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这 本 书 源 于 2005 年 在 哥伦比亚 大 学 一 个 地 下 室 中 发 生 的 事情 。 那 时 ， 我 还 
是 一 名 研究 生 ， 正 在 为 最 终 的 毕业 论文 做 一 项 在 线 实验 。 有 天 这 项 实验 的 
学 术 部 分 我 将 在 第 4 章 进行 介绍 ， 但 现在 ， 我 将 告诉 你 们 一 件 我 的 毕业 论 

文 或 其 他 任何 论文 都 未 涉及 的 事情 。 这 件 事 从 根本 上 改变 了 我 对 研究 的 看 


法 。 一 天 早晨 ， 当 我 来 到 位 于 地 下 室 的 工作 室 时 ， 我 发 现 一 夜 之 间 竟 有 约 
100 个 来 自 巴 西 的 人 参与 了 我 的 实验 。 这 一 简单 的 经 历 对 我 产生 了 深远 的 


影响 。 当 时 ， 我 的 几 个 朋友 正 醉 心 于 传统 的 实验 室 实 验 。 我 知道 他 们 必须 
很 费心 地 有 偿 召 集 并 指导 人 们 来 参与 实验 ， 如 果 一 天 能 有 10 个 人 完成 实 
验 ， 就 算是 不 错 的 进展 了 。 但 对 我 的 在 线 实验 来 说 ， 我 在 睡觉 的 同时 ， 就 
有 100 个 人 参与 了 实验 。 也 许 ， 一 边 睡 觉 一 边 做 研究 听 起 来 美好 得 令 人 难 
以 置信 ， 但 这 是 事实 。 技 术 的 变化 ， 尤 其 是 技术 从 模拟 时 代 到 数字 时 代 的 
转变 ， 意 味 着 我 们 可 以 用 新 的 方式 搜集 和 分 析 社 会 数据 。 这 本 书 就 是 关于 
如 何 利用 这 些 新 方式 开展 社会 研究 的 。 


这 本 书 是 写 给 那些 “ 想 研 究 更 多 数据 科学 的 社会 科学 家 ”和 “ 想 研究 更 多 社会 
科学 的 数据 科学 家 ”以 及 对 这 两 个 领域 的 结合 感 兴趣 的 人 的 。 因 此 ， 这 本 
书 的 目标 受众 自然 就 不 仅 限 于 学 生 和 教授 了 。 尽 管 我 目前 在 普林斯顿 大 学 
任职 ， 但 之 前 也 在 政府 部 门 (美国 人 口 调查 局 和 技术 产业 领域 的 微软 研究 
Be) 工作 过 ， 因 此 我 知道 ， 在 大 学 之 外 同样 存在 着 很 多 令 人 兴奋 的 研究 。 
因此 ， 只 要 你 觉得 自己 正在 做 的 是 社会 研究 ， 那 么 无 论 在 何 处 就 职 或 使 用 
何 种 技术 ， 你 都 可 以 参阅 此 书 。 


你 可 能 已 经 注意 到 了 ， 这 本 书 的 语言 风格 和 许多 其 他 的 学 术 著 作 稍 有 不 
同 。 这 其 实 是 我 特意 做 的 一 个 改变 。 这 本 书 的 部 分 内 容 源 于 我 从 2007 年 起 
在 普林斯顿 大 学 的 社会 学 系 带领 的 一 个 “计算 社会 学 ”( Computational 
Social Science) 研究 生 研 讨 班 ， 因 此 我 希望 它 能 反映 这 个 研讨 班 的 一 些 活 
力 和 激情 。 具 体 而 言 ， 我 希望 这 本 书 能 够 具备 以 下 三 个 特点 : 有 帮助 的 、 
面向 未 来 的 以 及 乐观 的 。 


有 帮助 的 : 我 的 目标 是 写 一 本 对 你 们 有 帮助 的 书 。 因 此 ， 我 将 以 坦诚 的 态 
度 、 非 正式 的 写作 风格 ， 通 过 实例 阐述 我 的 观点 。 我 最 想 传 达 的 是 一 种 特 
定 的 思考 社会 研究 的 方式 ， 而 经 验 告诉 我 ， 传 达 这 一 思考 方式 的 最 好 的 方 
法 就 是 采取 非 正 式 的 写作 风格 并 列举 大 量 例子 。 此 外 ， 在 本 书 的 参考 文献 
中 ， 有 一 个 部 分 叫 “ 拓 展 阅 读 ”, 它 则 在 帮 你 过 渡 到 有 关 我 所 介绍 的 多 个 主 
题 的 更 加 详细 、 更 加 专业 的 内 容 上 。 最 后 ， 我 希望 此 书 能 对 你 们 自己 开展 
研究 以 及 评估 别人 的 研究 有 所 帮助 。 


面向 未 来 的 : 我 希望 这 本 书 能 帮助 你 利用 现 有 的 以 及 未 来 将 出 现 的 数字 系 
统 开 展 社会 研究 。 我 是 从 2004 年 开始 做 这 类 研究 的 ， 这 期 间 数 字 系 统 发 生 
了 诸多 变化 ， 我 坚信 在 你 们 的 职业 生涯 中 ， 你 们 也 会 感受 到 数字 系统 的 许 
多 变化 。 因 此 ， 要 想 让 这 本 书 “ 以 不 变 应 万 变 ”， 就 要 做 到 “抽象 "。 例 如 ， 
这 本 书 不 会 教 你 如 何 使 用 现 有 的 推 特 应 用 程序 界面 (Twitter API) ， 相 
反 ， 它 会 教 你 如 何 受 益 于 大 数据 资源 ( 第 2 章 ) 。 这 本 书 不 会 详细 告诉 你 
如 何 利 用 亚马逊 土耳其 机 器 人 ( Amazon Mechanical Turk， 以 下 简称 机 器 
人 MTurk ) 开展 实验 步骤 ， 相反 ， 它 将 教 你 如 何 设 计 和 解读 依赖 于 数字 时 
代 基 础 设施 的 实验 ( 第 4 章 ) 。 通 过 采用 这 种 抽象 化 的 手法 ， 我 希望 这 本 
书 能 够 成 为 一 本 主题 适时 、 经 得 起 时 间 考 验 的 书 。 


乐观 的 : 本 书 涉及 两 个 群体 一 一 社会 科学 家 和 数据 科学 家 ， 他 们 有 着 截然 
不 同 的 背景 和 兴趣 。 除 了 书 中 将 要 介绍 的 科学 方面 的 差异 以 外 ， 我 还 发 

现 ， 这 两 个 群体 看 待 事物 的 态度 也 是 不 同 的。 数据 科 学 家 一 般 而 言 是 满怀 
希望 的 ， 而 社会 科学 家 一 般 而 言 是 更 具 批 判 性 的 。 也 就 是 说 ， 同 样 是 半 杯 
水 ， 数 据 科学 家 看 到 的 是 还 有 半 杯 水 ， 而 社会 科学 家 看 到 的 则 是 杯子 有 一 
半 已 经 空 了 。 在 本 书 中 ， 我 将 采取 数据 科学 家 的 乐观 态度 。 因 此 ， 在 描述 
相关 实例 时 ， 我 将 告诉 你 们 在 我 看 来 这 些 例 子 的 可 取 之 处 。 当 然 ， 鉴 于 没 
有 研究 是 完美 的 ， 我 也 会 指出 它们 的 问题 所 在 ， 但 我 会 尽力 用 乐观 积极 的 
方式 指出 。 我 不 会 为 批判 而 批判 ， 我 的 批判 是 为 了 能 让 你 们 设计 出 更 好 的 


研究 。 


我 们 仍 处 于 数字 时 代 社 会 研究 的 早期 阶段 ， 但 我 已 经 发 现 了 一 些 普遍 存在 
的 误解 ， 它 们 的 普遍 程度 让 我 觉得 有 必要 在 前 言 中 对 其 进行 说 明 。 就 数据 
科学 家 而 言 ， 我 发 现 他 们 有 两 个 常见 的 误解 。 第 一 个 是 认为 数据 越 多 越 有 
利于 解决 问题 。 但 对 社会 研究 来 说 ， 我 的 经 验 告 诉 我 并 不 是 这 样 的。 事实 
上 ， 对 社会 研究 来 说 ， 好 的 数据 似乎 要 比 更 多 的 数据 更 有 帮助 。 第 二 个 是 
数据 科学 家 通常 认为 社会 科学 只 不 过 是 一 堆 围 绕 常 识 的 花言巧语 罢了 。 当 
然 ， 作 为 一 名 社会 科学 家 ， 更 确切 地 说 是 社会 学 家 ， 我 不 同意 这 样 的 观 
点 。 聪 明 的 人 长 期 以 来 一 直 在 努力 理解 人 类 的 行为 ， 因 此 忽视 这 一 努力 所 
取得 的 成 果 似 乎 是 不 明智 的 。 我 希望 通过 这 本 书 ， 以 一 种 易于 理解 的 方式 
和 你 们 分 享 其 中 的 一 些 成 果 。 


就 社会 科学 家 而 言 ， 我 发 现 他 们 也 有 两 个 常见 的 误解 。 第 一 个 是 有 些 社 会 
科学 家 会 因为 少数 不 真实 的 数据 而 彻底 否定 使 用 数字 时 代 的 工具 开展 社会 
研究 这 一 观念 。 如 果 你 正在 读 这 本 书 ， 那 你 可 能 已 经 读 过 许多 平庸 地 或 错 
误 地 (或 两 种 方式 都 有 ) 使 用 社交 媒体 数据 的 论文 。 我 也 读 过 。 但 是 如 果 
因为 这 些 论文 就 得 出 结论 ， 说 数字 时 代 的 社会 研究 都 是 不 好 的 ， 这 将 是 一 
个 严重 的 错误 。 事 实 上 ， 你 可 能 也 读 过 许多 平庸 地 或 错误 地 使 用 调查 数据 
的 论文 ， 但 你 并 没有 因此 而 否定 所 有 使 用 调查 数据 的 论文 。 这 是 因为 你 知 


道 ， 也 有 使 用 调查 数据 并 且 做 得 很 不 错 的 研究 。 而 我 将 通过 这 本 书 告诉 你 
们 ， 使 用 数字 时 代 的 工具 并 且 做 得 很 不 错 的 研究 也 是 有 的 。 


我 所 发 现 的 社会 科学 家 的 第 二 个 常见 误解 是 容易 将 现在 和 未 来 混淆 。 当 我 
们 对 数字 时 代 的 社会 研究 ， 即 我 在 本 书 中 将 探讨 的 研究 ， 进 行 评估 时 ， 思 
考 以 下 两 个 截然 不 同 的 问题 至 关 重 要 :“ 这 类 研究 现在 做 得 怎么 样 ?以 及 “这 
类 研究 将 来 会 做 得 怎么 样 "。 研 究 人 员 会 被 训练 来 回答 第 一 个 问题 ， 但 对 
这 本 书 而 言 ， 我 认为 更 重要 的 是 第 二 个 问题 。 也 就 是 说 ， 尽 管 数字 时 代 的 
社会 研究 尚未 做 出 巨大 的 、 改 变 范 式 的 贡献 ， 但 数字 时 代 社 会 研究 的 进步 
速度 快 得 惊人 。 因 此 ， 相 比 于 其 目前 的 发 展 水 平 ， 它 的 变化 速度 更 让 我 感 
到 兴奋 不 已 。 


尽管 上 一 段 似 乎 是 在 告诉 你 们 ， 数 字 时 代 的 社会 研究 可 能 会 在 未 来 的 某 个 
时 间 变 得 相当 成 功 ， 但 我 的 目标 并 不 是 向 你 们 推销 任何 特定 类 型 的 研究 。 
我 个 人 并 未 持 有 推 特 (Twitter ) 、 脸 谱 网 (Facebook), 
(Google), 、 微 软 (Microsoft ) 、 苹 果 (Apple ) 或 其 他 任何 科技 公司 的 
股份 。 但 是 ， 为 了 做 到 充分 披露 ， 我 应 该 告诉 你 们 我 曾 在 微软 、 谷 歌 和 脸 
谱 网 工作 过 或 是 接受 过 其 研究 经 费 赞助 。 因 此 ， 在 整 本 书 中 ， 我 的 目标 是 
让 自己 做 一 个 可 信 的 叙述 者 ， 告 诉 你 们 所 有 可 能 的 令 人 兴奋 不 已 的 新 事 
物 ， 同 时 引导 你 们 避 开 一 些 我 曾 看 到 有 人 掉 进 去 的 陷阱 ( 有 的 我 自己 也 曾 
掉 进去 过 ) 。 


社会 科学 和 数据 科学 的 交叉 学 科 有 时 会 被 称 为 “计算 社会 学 "””。 有 些 人 认为 
这 是 一 个 技术 领域 ， 但 这 本 书 并 不 是 传统 意义 上 的 技术 图 书 。 例 如 ， 这 本 
书 的 正文 中 并 没有 公式 。 之 所 以 选择 这 样 的 方式 ， 是 因为 我 想 呈 现 对 数字 
时 代 社 会 研究 的 一 个 全 面 的 看 法 ， 其 中 包括 大 数据 资源 、 调 查 、 实 验 、 大 
规模 协作 和 道德 伦理 。 但 事实 证 明 ， 涵盖 所 有 这 些 主题 并 提供 每 个 主题 中 
详细 的 技术 细节 是 不 可 能 的 。 相 反 ， 我 会 在 本 书 参考 文献 中 的 “拓展 阅 
读 ” 里 推荐 更 多 的 技术 资料 。 换 句 话 说， 这 本 书 不 是 为 了 教 你 如 何 做 某 种 
特定 的 计算 ， 而 是 为 了 改变 你 对 社会 研究 的 思考 方式 而 写 的 。 


如 何在 教学 中 使 用 这 本 书 ? 正如 前 面 所 述 ， 本 书 的 部 分 内 容 来 自我 从 2007 
年 开始 在 普林斯顿 大 学 带领 的 一 个 “计算 社会 学 ”研究 生 研讨 班 。 你 们 可 能 
想 用 这 本 书 进行 教学 ， 所 以 我 觉得 有 必要 解释 一 下 我 是 如 何 将 源 于 课堂 的 
素材 写成 这 本 书 的 ， 以 及 我 想象 的 这 本 书 在 其 他 课堂 中 的 使 用 方式 。 


有 几 年 时 间 ， 我 上 课 是 没有 指定 教材 的 ， 我 只 是 给 学 生 指 定 一 些 文章 。 虽 
然 他 们 能 够 从 这 些 文 章 中 学 到 东西 ， 但 只 学 习 这 些 文 章 还 不 足以 让 他 们 发 
生 我 所 期 待 的 观念 转变 。 所 以 我 会 用 课堂 大 部 分 的 时 间 讲 述 这 些 文章 的 背 
景 ， 讲 述 应 该 采取 怎样 的 视角 以 及 给 予 他 们 建议 ， 进 而 帮助 学 生 获 得 更 全 
面 的 认识 。 在 这 本 书 中 ， 我 试图 以 不 涉及 社会 科学 或 数据 科学 专业 知识 的 


方式 记录 上 述 所 有 的 背景 、 视 角 和 建议 。 


对 于 为 期 一 学 期 的 课程 ， 我 建议 将 这 本 书 与 其 他 各 种 阅读 材料 配套 使 用 。 
例如 ， 课 程 可 能 会 花 两 周 时 间 来 做 实验 ， 这 时 你 可 以 使 用 第 4 章 的 内 容 , 
同时 选取 诸如 以 下 主题 的 阅读 材料 : 预 处 理 信 息 在 实验 设计 和 分 析 中 的 作 
用 ; 在 公司 大 规模 的 A/B 测 试 过 程 中 所 浮现 出 来 的 统计 和 计算 问题 ; 实验 
设计 ， 尤 其 是 原理 方面 ， 以 及 与 通过 机 器 人 MTurk 这 样 的 在 线 劳 动力 市 场 
招募 实验 参与 者 相关 的 实践 、 科 学 和 伦理 方面 的 问题 。 你 也 可 结合 编程 方 
面 的 阅读 材料 或 活动 。 至 于 如 何 从 这 些 材料 中 选 出 合适 的 配套 材料 ， 就 取 
决 于 你 的 学 生 ( 是 本 科 、 研 究 生 还 是 博士 ) 以 及 他 们 的 背景 和 目标 。 


在 一 个 为 期 一 学 期 的 课程 中 ， 你 也 可 以 每 周 给 学 生 分 配 一 些 任务 。 这 本 书 
的 每 一 章 都 会 涉及 各 种 各 样 的 “活动 ”， 我 将 把 “活动 ” 放 在 参考 文献 中 ， 同 
时 我 也 标注 了 它们 的 难度 等 级 : 简单 CON), he CN). ME 

( [image] ) 以 及 非常 困难 (PA). 。 此 外 ， 我 还 标注 了 每 个 问题 所 需 
的 技能 : 数学 ( 国 ) se (lA) 以 及 数据 采集 (&). SE, 
我 个 人 比较 喜欢 的 活动 ， 我 会 备注 心 形 图 标 ( 声 ) 。 我 希望 在 这 么 多 的 
任务 活动 中 ， 你 能 找到 适合 自己 的 。 

为 了 帮助 人 们 在 教学 中 使 用 这 本 书 ， 我 已 经 开始 搜集 相关 的 教学 资料 了 ， 


例如 教学 大 纲 、 幻 灯 片 、 每 章 推荐 的 配合 材料 以 及 一 些 任务 活动 的 解决 方 
案 。 你 可 以 访问 http://www.bitbybitbook.com 查 看 或 完善 这 些 资料 。 


1.1 一 处 墨迹 


2009 年 夏天 ， 手 机 铃声 响 遍 了 整个 卢旺达 。 除 了 来 自家 人 、 朋 友和 商业 伙 
伴 的 数 百 万 个 电话 之 外 ,大约 有 1000 名 卢旺达 人 还 接 到 了 由 乔 舒 亚 . 布 卢 

门 斯 托 克 (Joshua Blumenstock ) 及 其 同事 打 来 的 电话 。 研 究 人 员 从 卢 旺 
达 最 大 手机 供应 商 的 数据 库 中 随机 抽样 进行 调查 ， 以 完成 对 财富 与 贫 因 的 
研究 ， 这 个 数据 库 中 有 150 万 名 客户 。 布 卢 门 斯 托 克 和 他 的 同事 会 询问 这 

些 被 随机 选中 的 人 是 否 愿 意 参与 调查 ， 然 后 向 其 解释 这 项 研究 的 性 质 ， 接 
下 来 便 会 询问 一 系列 有 关 他 们 的 人 口 学 特征 、 社 会 特征 和 经 济 特征 方面 的 


问题 。 


到 目前 为 止 ， 我 所 描述 的 一 切 都 让 这 项 研究 听 起 来 像 是 一 项 传统 的 社会 科 
学 调查 。 但 接 下 来 我 要 描述 的 就 不 再 传统 了 ， 至少 目 前 来 说 是 这 样 的 。 除 
了 调查 而 来 的 数据 外 ， 布 卢 门 斯 托 克 和 同事 还 拥有 这 150 万 人 的 完整 通话 
记录 。 他 们 将 这 两 部 分 数据 结合 起 来 ， 利 用 调查 数据 训练 了 一 个 机 器 学 习 
模型 ， 使 模型 能 根据 一 个 人 的 通话 记录 预测 其 财富 状况 。 接 着 ， 他 们 利用 
这 个 模型 评估 数据 库 中 150 万 名 客户 的 财富 状况 ， 还 利用 通话 记录 中 包含 
的 地 理 信 息 判 断 这 150 万 名 客户 的 居住 位 置 。 最 后 他 们 将 所 有 这 些 信息 
一 一 估算 的 财富 状况 以 及 居住 位 置 ， 综 合 到 一 起 ， 绘 制 出 高 分 辨 率 的 卢 旺 
达 财 富 地 理 分 布 图 。 尤 其 是 ， 他 们 能 够 估算 出 卢旺达 2148 个 街区 ( 该 国 的 
最 小 行政 单位 ) 中 每 一 个 街区 的 财富 状况 。 


要 证 实 这 些 估算 是 不 可 能 的 ， 因 为 从 来 没有 人 估算 过 卢旺达 中 如 此 小 的 地 
理 区 域 的 财富 状况 。 但 在 布 卢 门 斯 托 克 和 同事 把 这 些 估算 值 汇总 为 分 别 反 
了 上映 卢旺达 30 个 地 区 财富 状况 的 数值 后 ， 他 们 发 现 ， 这 些 数 值 与 通过 人 口 统 
计 和 健康 调查 ( Demographic and Health Survey ) 得 到 的 数据 非常 接 

近 ， 而 人 口 统 计 和 健康 调查 被 认为 是 发 展 中 国家 调查 的 黄金 标准 。 虽 然 这 
两 种 方法 在 此 案例 中 产生 了 类 似 的 结果 ， 但 布 卢 门 斯 托 克 和 同事 的 方法 要 
比 传统 的 人 口 统 计 和 健康 调查 的 方法 快 了 差不多 10 倍 ， 成 本 为 后 者 的 1/50 
左右 。 这 些 明 显 更 快 、 更 节省 成 本 的 预测 为 研究 人 员 、 政 府 和 公司 创造 了 
新 的 可 能 性 ( Blumenstock, Cadamuro, and On 2015 ) 。 


这 项 研究 有 点 像 二 个 罗 夏 墨迹 测验 ( 主 ) . 人 们 看 到 的 事物 取决 于 他 们 的 背 
UE Sed ae eT eA oC LAade 
济 发 展 理论 ， 许 多 数据 科学 家 从 中 看 到 了 一 个 很 酷 的 、 新 的 机 器 学 习 问 

题 。 许 多 商界 人 士 看 到 了 一 个 可 以 让 他 们 从 已 经 搜集 到 的 大 数据 中 获 利 的 
好 方法 ， 许 多 隐私 权 倡导 者 从 中 看 到 了 一 个 可 怕 的 警示 : 我 们 也 许 生活 在 
一 个 大 规模 监控 的 时 代 。 最 后 ， 许 多 政策 制定 者 从 中 看 到 了 新 技术 能 够 帮 
助 我 们 创造 一 个 更 好 的 世界 。 黄 实 ， 这 项 研究 与 这 些 都 相关 ， 而 且 正 是 因 


1. 


融合 了 这 么 多 特征 ， 所 以 我 把 它 看 作 了 解 社 会 研究 之 未 来 的 一 扇 窗 。 


罗 夏 墨迹 测验 是 一 种 著名 的 人 格 测验 ， 它 会 向 被 试 呈现 由 墨迹 偶然 形 
成 的 图 案 ， 让 被 试 观看 并 说 出 由 此 联想 到 的 事 ， 研 究 人 员 由 此 对 反应 符号 
进行 分 析 ， 从 而 判断 被 试 的 人 格 特征 。 一 一 编者 注 


1.2 欢迎 来 到 数字 时 代 
数字 时 代 无 处 不 在 ， 它 在 不 断 发 展 ， 并 且 改 变 着 研究 的 可 能 性 。 


这 本 书 的 核心 前 提 是 数字 时 代 能 为 社会 研究 创造 新 的 机 会 。 研 究 人 员 现 在 
能 以 不 久 前 还 几乎 不 可 能 的 方式 观察 行为 、 提 出 问题 、 开 展 实验 以 及 彼此 
协作 。 但 新 的 风险 也 随 之 而 来 : 研究 人 员 现 在 能 以 过 去 绝 不 可 能 的 方式 去 
伤害 人 人们。 这些 机 会 和 风险 源 于 从 模拟 时 代 到 数字 时 代 的 转变 。 这 种 转变 
并 不 是 像 开 灯 那 样 瞬间 就 发 生 了 ， 事 实 上 ， 这 种 转变 目前 还 尚未 彻底 完 
成 。 但 目前 为 止 发 生 的 事情 ， 已 经 足以 让 我 们 相信 有 大 事 正 在 发 生 了 。 


注意 到 这 种 转变 的 一 个 方法 是 观察 发 现 你 们 日 常生 活 中 的 变化 。 生 活 中 ， 
许多 曾经 是 模拟 的 东西 现在 变 成 智能 的 了 。 也 许 你 曾经 用 的 是 带 胶卷 的 相 
机 ， 但 现在 用 的 是 数码 相机 ( 可 能 你 们 的 智能 手机 就 有 数码 相机 的 功 

能 ) 。 也 许 你 们 曾经 读 的 是 纸 质 的 报纸 ， 现 在 却 在 线 看 新 闻 。 也 许 你 们 曾 
经 用 现金 来 付款 ， 现 在 却 是 用 信用 卡 。 在 上 述 每 一 种 情况 下 ， 从 模拟 到 数 
字 的 转变 ， 都 意味 着 更 多 关于 你 的 信息 被 以 数字 化 的 形式 获取 并 存储 了 下 
Re 


事实 上 ， 总 体 来 看 ， 从 模拟 到 数字 的 转变 所 产生 的 影响 是 非常 惊人 的 。 信 
息 量 正 在 迅速 增加 ， 更 多 的 信息 以 数字 化 的 形式 被 存储 ， 进 而 便于 分 析 、 
传输 和 归并 。 这 些 数字 信息 被 称 为 “大 数据 ”。 在 数字 数据 爆炸 式 增长 的 同 
时 ， 有 条 件 使 用 计算 机 的 人 的 数量 也 在 不 断 增加 (图 1.1 ) 。 这 些 趋势 ， 
即 越 来 越 多 的 数字 数据 以 及 越 来 越 多 的 使 用 计算 机 的 人 ， 在 可 预见 的 未 来 
很 可 能 会 持续 下 去 。 


(10 亿 吉 字 节 ) 信息 存储 
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图 1.1 信息 存储 能 力 和 计算 能 力 正 在 显著 提高 。 此 外 ， 信 息 存 储 现 在 几乎 
已 经 全 部 数字 化 了 。 这 些 变化 为 社会 研究 人 员 创 造 了 不 可 思议 的 机 会 。 改 


t# Hilbert and Lépez ( 2011 ) 。 


考虑 到 社会 研究 的 目的 ， 我 认为 数字 时 代 最 重要 的 特征 就 是 计算 机 随处 可 
见 。 从 最 初 房间 般 大 的 、 只 有 政府 和 大 公司 才能 使 用 的 计算 机 发 展 而 来 ， 
今天 的 计算 机 ， 其 尺寸 在 不 断 缩 小 ， 普 及 程度 在 不 断 增加 。 从 20 世 纪 80 年 
代 开 始 ， 每 10 年 就 会 有 一 种 新 型 的 计算 机 诞生 : 个 人 计算 机 、 笔 记 本 电 
脑 、 智 能 手机 以 及 现在 “ 物 联网 ?中 的 嵌入 式 处 理 器 ( 即 汽 车 、 手 表 和 恒温 
器 等 设备 内 部 的 戏 入 式 计 算 机 ) (Waldrop 2016 ) 。 除 了 计算 ， 这 些 随处 
可 见 的 计算 机 还 开始 具备 越 来 越 多 的 功能 : 感知 、 存 储 和 传输 信息 。 


对 研究 人 员 来 说 ， 利 用 网 络 最 容易 看 出 随处 可 见 的 计算 机 所 产生 的 影响 。 
互联 网 是 一 个 被 全 面 监测 的 环境 ， 非 常 适合 研究 人 员 开 展 实验 。 例 如 ， 一 
个 网 上 商店 很 容易 就 可 以 搜集 到 精确 的 数 百 万 顾客 的 购买 行为 数据 。 然 
后 ， 它 可 以 随机 选择 几 组 顾客 并 为 其 提供 不 同 的 购物 体验 。 这 种 在 精准 掌 
握 了 顾客 购物 数据 的 基础 上 再 进行 随机 选择 的 能 力 ， 意 味 着 网 上 商店 能 够 
寺 续 开 展 随机 对 照 实 验 。 事 实 上 ， 只 要 曾 在 网 上 买 过 东西 ， 你 的 购买 行为 
就 已 经 被 记录 下 来 了 ， 之 后 你 也 几乎 必然 地 会 成 为 某 项 实验 的 参与 者 ， 无 
论 你 自己 是 否 知道 。 


这 种 被 全 面 监测 、 完 全 随机 化 的 情况 不 仅 局 限于 网 上 ， 这 在 线 下 也 开始 变 
得 越 来 越 普遍 。 实 体 店 已 经 搜集 了 非常 详细 的 购买 行为 数据 ， 同 时 它们 也 
正在 开发 相关 基础 设施 ， 以 便 追踪 顾客 的 购买 行为 ， 并 将 实验 研究 结果 用 
于 日 常 商 业 活动 中 。“ 物 联网 ”意味 着 现实 世界 中 的 行为 会 越 来 越 多 地 被 数 
字 传 感 器 捕获 。 换 句 话说 就 是 ， 当 你 思考 数字 时 代 的 社会 研究 时 ， 你 不 应 
该 只 想到 “在 线 ? 社 会 研究 ， 你 应 该 想到 它 可 以 发 生 在 任何 地 方 。 


数字 时 代 使 行为 测量 和 实施 随机 化 的 处 理 成 为 可 能 ， 同 时 还 为 人 们 创造 了 
新 的 交流 途径 。 这 些 新 的 交流 途径 使 研究 人 员 能 够 开展 创新 性 的 调查 ， 并 
与 同事 以 及 普通 大 众 进行 大 规模 协作 。 


怀疑 论 者 可 能 会 说 ， 上 述 这 些 功 能 并 不 能 算是 真正 意义 上 的 新 事物 。 也 就 
是 说 ， 在 过 去 ， 人 们 的 交流 途径 也 曾 有 过 其 他 一 些 重大 的 进步 ， 例 如 电报 
(Gleick 2011) ， 而 且 自 20 世 纪 60 年 代 以 来 ， 计 算 机 的 运行 速度 也 基本 
上 一 直 在 以 同样 的 速度 增长 ( Waldrop 2016 ) 。 但 这 些 怀 疑 论 者 所 忽略 的 
是 ， 在 某 种 程度 上 ， 多 个 相同 的 东西 合 起 来 会 变 成 一 个 不 同 的 东西 

( Halevy, Norvig, and Pereira 2009 ) 。 让 我 用 我 喜欢 的 一 个 类 比 来 阐明 
这 一 观点 : 如 果 你 能 捕捉 到 一 匹 马 在 某 一 刻 的 画面 ， 你 便 拥有 了 一 张 照 
片 ; 而 如 果 你 在 一 秒 内 捕捉 到 一 匹 马 的 24 个 画面 ， 那 么 你 便 拥有 了 一 部 电 
影 的 片段 。 当 然 ， 一 部 电影 其 实 就 是 许多 张 照 片 ， 但 只 有 顽固 的 怀疑 论 者 
才 会 坚持 声称 照片 和 电影 完全 一 样 。 


研究 人 员 正 在 进行 一 项 类 似 于 从 摄影 到 拍 电影 的 转变 ， 但 这 一 转变 并 不 代 
表 我 们 过 去 所 学 的 所 有 东西 都 应 该 被 据 弃 。 正 如 摄影 的 原理 会 影响 拍 电影 
的 原理 一 样 ， 那 些 在 过 去 100 年 里 发 展 起 来 的 社会 研究 理论 也 会 对 未 来 
100 年 的 社会 研究 产生 影响 。 这 一 转变 意味 着 我 们 不 应 该 一 直 做 同样 的 事 
情 。 相 反 ， 我 们 必须 把 过 去 的 、 现 在 的 以 及 未 来 的 方法 结合 起 来 。 例 如 ， 
乔 舒 亚 : 布 户 门 斯 托 克 和 同事 所 做 的 研究 就 结合 了 传统 的 调查 研究 和 一 些 人 
可 能 称 之 为 数据 科学 的 方法 。 单 赁 调查 研究 或 是 单 赁 通话 记录 都 无 法 绘制 
出 高 分 辨 率 的 反映 财富 估 值 的 地 图 ， 这 两 个 是 缺 一 不 可 的 。 更 概括 地 说 ， 
社会 研究 人 员 需 要 将 社会 科学 和 数据 科学 的 思想 结合 起 来 ， 才 能 充分 利用 
数字 时 代 带 来 的 机 会 ， 只 靠 其 一 是 不 够 的 。 


1.3 研究 设计 
研究 设计 是 将 问题 和 答案 联系 起 来 。 


本 书 是 为 两 个 群体 所 写 的 ， 这 两 个 群体 有 很 多 需要 互相 学 习 的 地 方 。 一 方 
面 ， 这 本 书 是 写 给 社会 科学 家 的 ， 他 们 接受 过 社会 行为 研究 方面 的 训练 ， 
也 有 这 方面 的 经 验 ， 但 对 数字 时 代 所 带 来 的 机 会 不 是 很 熟悉 。 另 一 方面 ， 
这 本 书 是 写 给 那些 能 得 心 应 手 地 使 用 数字 时 代 工 具 ， 但 对 社会 行为 研究 来 
说 是 新 手 的 研究 人 员 的 。 这 类 研究 人 员 不 愿 被 冠 以 一 个 简单 的 称谓 ， 但 我 
将 把 他 们 称 为 数据 科学 家 。 这 些 数 据 科学 家 经 常会 接受 计算 机 科学 、 统 计 
学 、 信 息 科学 、 工 程 学 和 物理 学 等 方面 的 训练 ， 已 成 为 最 早 开展 数字 时 代 
社会 研究 的 一 群 人 ， 这 部 分 是 因为 他 们 能 够 获得 必要 的 数据 ， 同 时 也 具备 
相应 的 计算 能 力 。 本 书 试图 让 这 两 个 群体 彼此 合作 ， 进 而 创造 出 比 单独 一 
个 群体 所 能 创造 的 更 加 丰富 、 更 加 有 趣 的 东西 。 


要 实现 这 一 强 有 力 的 合作 ， 最 好 的 方式 不 是 专注 于 抽象 的 社会 理论 或 是 花 
哨 的 机 器 学 习 。 最 好 的 起 点 是 研究 设计 。 如 果 你 将 社会 研究 看 作 询 问 和 回 
答 有 关 人 类 行为 问题 的 过 程 ， 那 么 研究 设计 就 是 “结缔 组 织 ”, 它 能 将 问题 
和 答案 联系 起 来 。 而 建立 正确 的 联系 是 设计 出 令 人 信服 的 研究 的 关键 。 本 
书 将 重点 介绍 4 种 方法 : 观察 行为 、 提 问 、 开 展 实验 以 及 与 他 人 合作 。 这 
些 方法 你 之 前 应 该 已 经 见 过 或 可 能 用 过 ， 但 特别 之 处 在 于 ， 数 字 时 代为 我 
们 带 来 了 新 的 搜集 和 分 析 数 据 的 机 会 。 这 些 新 机 会 要 求 我 们 将 这 些 经 典 的 
方法 现代 化 ， 但 不 是 要 取代 这 些 方法 。 


1.4 本 书 的 主题 


本 书 的 两 个 主题 分 别 是 : (1) 将 现成 品 和 定制 物 结合 起 来 (2) 道德 伦 
理 。 


这 两 个 主题 将 贯穿 整 本 书 ， 我 之 所 以 在 这 里 强调 它们 ， 是 为 了 让 你 们 在 其 
反复 出 现时 能 够 注意 到 。 第 一 个 主题 可 以 通过 对 比 马 塞 尔 . 杜 尚 ( Marcel 
Duchamp ) 和 米 开朗 琪 罗 ( Michelangelo ) 这 两 位 伟人 来 阐述 。 杜 尚 主要 
是 因为 他 的 现成 品 艺术 作品 (例如 《 泉 》 ) 而 闻名 ， 这些 艺术 作品 都 是 普 
通 物品 经 他 稍 做 修改 而 创造 出 来 的 。 而 米 开朗 琪 罗 则 不 是 通过 修改 现成 品 
进行 创作 的 。 当 他 想 创作 一 尊 大 卫 的 雕像 时 ， 他 并 没有 去 寻找 一 块 看 起 来 
像 大 卫 的 大 理 石 ， 而 是 花 了 三 年 的 时 间 有 雕刻 出 了 他 的 杰作 。 因 此 ，《 大 
卫 》 不 是 一 个 现成 品 艺术 作品 ， 而 是 一 个 非 现 成 品 艺术 作品 (图 1.2 ) 。 


这 两 种 风格 一 一 现成 品 艺术 作品 和 非 现成 品 艺术 作品 ， 大 致 可 以 映射 出 数 
字 时 代 的 社会 研究 所 采用 的 风格 。 正 如 你 们 将 要 看 到 的 ， 本 书 中 的 一 些 例 
子 就 涉及 对 某 些 大 数据 资源 的 巧妙 的 重新 配置 ， 而 这 些 大 数据 资源 最 初 是 
由 公司 或 政府 所 创建 的 。 在 其 他 例子 中 ， 研 究 人 员 则 从 一 个 特定 的 问题 出 
发 ， 然 后 使 用 数字 化 工具 创建 出 回答 该 问题 所 需 的 数据 。 如 果 做 得 好 的 
话 ， 这 两 种 模式 都 非常 强大 。 因 此 ， 数 字 时 代 的 社会 研究 将 既 包 括 现成 品 
作品 又 包括 非 现成 品 作品 ， 既 包括 杜 尚 又 包括 米 开朗 琪 罗 。 


如 果 你 们 通常 使 用 的 是 现成 数据 ， 那么 我 希望 这 本 书 能 告诉 你 们 非 现成 数 
据 的 价值 。 同 样 ， 如 果 你 们 通常 使 用 的 是 非 现成 数据 ， 那 么 我 希望 这 本 书 
能 告诉 你 们 现成 数据 的 价值 。 最 后 ， 也 是 最 重要 的 ， 我 希望 这 本 书 能 告诉 
你 将 这 两 种 数据 结合 起 来 使 用 的 价值 。 例 如 ， 乔 舒 亚 布 卢 门 斯 托 克 及 其 同 
事 就 是 杜 尚 和 米 开 朗 琪 罗 的 结合 体 : 他 们 把 通话 内 容 录 音 ( 一 个 现成 数 
据 ) 用 于 不 同 的 用 途 ， 同 时 又 创建 了 自己 的 调查 数据 ( 一 个 非 现 成 数 

据 ) 。 在 整 本 书 中 ， 你 们 都 将 看 到 现成 品 与 非 现成 品 的 结合 ， 这 种 结合 往 
往 既 需要 社会 科学 的 思想 也 需要 数据 科学 的 思想 ， 并 且 这 种 结合 常常 会 市 
来 最 令 人 兴奋 的 研究 。 


现成 品 艺 术 作品 非 现 成 品 艺术 作品 

图 1.2 马 塞 尔 . 杜 尚 的 《 泉 》 和 米 开 朗 琪 罗 的 《大 卫 》。《 泉 》 就 是 一 件 现 
成 品 艺 术 作 品 ， 这 类 作品 是 艺术 家 对 现实 世界 中 已 经 存在 的 东西 进行 创造 
性 加 工 修改 后 而 产生 的 艺术 品 。 而 《大 卫 》 则 是 有 意 创 造 的 艺术 品 ， 是 一 
件 非 现 成 品 艺术 作品 。 数 字 时代 的 社会 研究 将 既 包括 现成 品 作品 又 包括 非 
现成 品 作品 。《 泉 》 由 艾 尔 弗 雷 德 施 蒂 格 利 滨 ( Alfred Stieglitz ) 摄 于 
1917 年 (来源 : The Blind Man, no.2/Wikimedia Commons), (XL) 
由 约 尔格 :比特 纳 . 翁 纳 ( JOrg Bittner Unna ) #82008 ( KE : Galleria 
dell’Accademia, Florence/Wikimedia Commons ) 。 


贯穿 本 书 的 第 二 个 主题 是 道德 伦理 。 我 将 告诉 你 们 ， 研 究 人 员 如 何 利 用 数 
字 时 代 的 机 会 开展 令 人 兴奋 且 意 义 重 大 的 实验 。 同 时 我 也 将 告诉 你 们 ， 利 
用 这 些 机 会 的 研究 人 员 将 如 何 做 出 艰难 的 伦理 决策 。 本 书 第 6 章 全 部 是 关 
于 道德 伦理 的 ， 但 其 他 章节 也 会 涉及 这 一 话题 ， 因 为 在 数字 时 代 ， 道 德 伦 
理 将 成 为 研究 设计 中 越 来 越 重要 的 一 个 部 分 。 


布 卢 门 斯 托 克 及 同事 的 实验 可 以 再 次 被 用 来 证 明 这 一 点 。150 万 人 的 通话 
记录 为 他 们 的 研究 创造 了 很 好 的 机 会 ， 但 同时 也 提供 了 造成 伤害 的 机 会 。 

例如 ， FAR ES (Jonathan Mayer) 及 同事 在 2016 年 已 经 表明 ， 即 使 
是 对 “匿名 化 ”的 通话 内 容 录 音 ( 即 没有 名 字 和 地 址 的 数据 ) ， 在 结合 公开 
信息 后 ， 研 究 人 员 也 可 能 从 中 识别 出 属于 某 些 特定 人 员 的 通话 内 容 ， 进 而 
推断 出 有 关 他 们 的 敏感 信息 ， 例 如 某 些 健康 状况 的 信息 。 也 就 是 说 ， 虽然 
布 卢 门 斯 托 克 及 同事 并 未 试图 找 出 某 些 特定 的 人 并 推断 有 关 他 们 的 敏感 信 
息 ， 但 这 一 可 能 性 会 让 他 们 很 难 拿 到 通话 数据 ， 这 迫使 他 们 在 进行 研究 时 


要 采取 全 面 的 保护 措施 。 


除了 详细 的 通话 记录 以 外 ， 数 字 时 代 的 许多 社会 研究 中 都 存在 一 个 让 人 很 
不 安 的 根本 性 问题 : 研究 人 员 ( 经 常 与 公司 和 政府 合作 ) 对 实验 参与 者 的 
生活 拥有 越 来 越 强 的 控制 力 。 我 所 说 的 控制 力 是 指 在 未 征 得 参与 者 同意 ， 
甚至 在 他 们 不 知情 的 情况 下 ， 对 他 们 做 一 些 事情 的 能 力 。 例 如 ， 研究 人 员 
现在 可 以 观察 数 百 万 人 的 行为 ， 而 且 正 如 我 后 文 将 描述 的 ， 研 究 人 员 也 可 
以 让 数 百 万 人 参加 大 规模 的 实验 。 所 有 这 些 事情 都 可 能 在 未 征 得 当事人 同 
意 或 其 不 知情 的 情况 下 进行 。 研 究 人 员 的 控制 力 在 不 断 增 强 ， 对 如 何 使 用 
这 一 控制 力 的 规范 却 没有 相应 地 变 得 更 加 明确 。 也 就 是 说 ， 研 究 人 员 必 须 
在 彼此 不 一 致 、 相 互 重 苔 的 法 律 法 规 的 基础 上 决定 他 们 该 如 何 行使 这 一 控 
制 力 。 因 此 ， 即 便 是 善意 的 研究 人 员 ， 在 面 对 强 大 的 控制 力 和 模糊 的 指导 
方针 时 ， 可 能 也 会 被 迫 去 做 一 些 艰难 的 抉择 。 


如 果 你 们 通常 天 注 的 是 数字 时 代 的 社会 研究 所 创造 的 新 机 会 ， 那 么 我 希望 
这 本 书 能 让 你 们 明白 这 些 机 会 也 会 带 来 新 的 风险 。 同 样 ， 如 果 你 们 通常 关 
注 的 是 这 些 风险 ， 那 么 我 希望 这 本 书 能 帮助 你 们 发 现 新 机 会 (需要 冒险 的 
机 会 ) 。 最 后 ， 同 时 也 是 最 重要 的 ， 我 希望 这 本 书 能 帮助 大 家 负责 任 地 平 
衡 数 字 时 代 的 社会 研究 所 带 来 的 机 会 和 风险 。 当 研究 人 员 开 始 拥 有 更 强 的 
控制 力 时 ， 他 们 也 必须 承担 更 大 的 社会 责任 。 
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2.5 结论 


大 数据 资源 无 处 不 在 ， 但 利用 它们 进行 社会 研究 可 能 会 遇 到 很 多 问题 。 根 
据 我 的 经 验 ，“ 天 上 不 会 掉 馅 饼 ” 这 类 规则 也 适用 于 社会 研究 的 数据 : 如 果 
你 不 投入 大 量 工作 来 搜集 数据 ， 那 么 你 可 能 需要 投入 大 量 工作 去 思考 和 分 
析 数 据 。 


今天 的 大 数据 资源 往往 具有 以 下 10 个 特征 ， 未 来 的 大 数据 资源 也 可 能 如 
此 。 其 中 有 3 个 特征 通常 是 ( 但 并 不 总 是 ) 有 助 于 研究 的 : 海量 性 、 持 续 
性 以 及 不 反应 性 。 而 其 余 7 个 则 通常 是 ( 但 并 不 总 是 ) 不 利于 研究 的 : 不 
完整 性 、 难 以 获取 、 不 具 代 表 性 、 漂 移 、 算 法 干扰 、 脏 数据 以 及 敏感 性 。 
其 中 许多 特征 之 所 以 会 出 现 ， 是 因为 大 数据 资源 并 不 是 为 了 社会 研究 而 创 
建 的 。 


基于 本 章 的 观点 ， 我 认为 以 下 三 点 最 能 说 明 大 数据 资源 在 社会 研究 中 的 价 
值 。 首 先 ， 大 数据 资源 能 让 研究 人 员 验 证 两 个 互相 矛盾 的 理论 预测 的 正 
误 ， 比 如 法 伯 的 纽约 市 出 租车 司机 研究 。 其 次 ， 基 于 大 数据 资源 的 临近 预 
测 能 为 决策 者 提供 更 好 的 评估 信息 ， 该 类 研究 的 一 个 事例 是 金 斯 伯 格 等 人 
的 谷歌 流感 趋势 研究 。 最 后 ， 大 数据 资源 有 助 于 研究 人 员 在 不 开展 实验 的 
情况 下 进行 因果 推断 ， 该 类 研究 的 事例 包括 马 斯 和 莫 雷 蒂 针 对 同 傍 效 应 对 
生产 力 影响 的 研究 以 及 埃 纳 维 等 人 针对 易 贝 上 起 拍 价 对 拍卖 影响 的 研究 。 
然而 ， 无 论 是 上 述 哪 一 种 情形 ， 都 需要 研究 人 员 赋 予 数 据 更 多 东西 ， 例 如 
确定 对 因果 推断 很 重要 的 研究 定量 或 两 个 观点 互相 矛盾 的 理论 。 因 此 ， 我 
认为 对 大 数据 资源 的 作用 的 最 好 描述 是 ， 它 们 能 够 帮助 那些 可 以 提出 有 趣 
且 重 要 问题 的 研究 人 员 。 


本 章 结束 之 前 ， 我 认为 还 有 一 个 问题 值得 思考 ， 那 就 是 大 数据 资源 可 能 对 
数据 和 理论 之 间 的 关系 产生 重要 的 影响 。 目 前 为 止 ， 本 章 所 采用 的 方法 是 
理论 导向 的 实证 研究 。 但 大 数据 资源 也 能 让 研究 人 员 进 行 实 证 导向 的 理论 
推理 。 也 就 是 说 ， 通 过 仔细 积累 经 验 事实 、 实 际 模式 和 难 解 之 题 ， 研 究 人 
员 可 以 建立 新 的 理论 。 这 一 非 传统 的 、 在 没有 理论 假设 的 情况 下 直接 从 数 
据 入手 建 立 理论 的 方法 并 非 是 首次 被 提 及 ， 巴 尼 . 格 拉 泽 (Barney Glaser ) 
和 安 塞 尔 姆 . 施 特 劳 斯 ( Anselm Strauss ) 在 其 提倡 扎根 理论 的 著作 中 就 对 
这 一 方法 进行 了 最 有 力 的 阐述 。 但 这 种 直接 从 数据 入 手 的 方法 并 没有 像 数 
字 时 代 的 一 些 有 关 研 究 的 文章 所 宣称 的 那样 意味 着 “理论 的 终 

45” (Anderson 2008 ) 。 相 反 ， 随 着 数据 环境 的 变化 ， 我 们 应 该 期 望 数 据 
和 理论 的 关系 能 重新 得 到 平衡 。 在 过 去 ， 数 据 采集 是 很 昂贵 的 ， 因 此 只 搜 
集 那 些 理论 表明 最 有 用 的 数据 是 说 得 通 的 。 但 现在 ， 我 们 有 海量 的 可 以 免 
费 使 用 的 数据 ， 因 此 除了 搜集 最 有 用 的 数据 以 外 ， 尝 试 直接 从 现 有 数据 入 


手 也 是 可 以 的 (Goldberg 2015), 


本 章 内 容 表 明 ， 研 究 人 员 通 过 观察 人 类 可 以 了 解 到 很 多 东西 。 在 接 下 来 的 
几 章 中 ， 我 将 介绍 如 何 通 过 调整 数据 采集 的 方法 ， 通 过 提问 ( 第 3 章 ) 、 
开展 实验 (第 4 章 ) ， 甚 至 直接 选择 一 部 分 人 参与 研究 过 程 ( 第 5 章 ) 这 些 
与 人 们 更 直接 的 互动 了 解 更 多 不 同 的 东西 。 


3m ”提问 


3.1 简介 


因为 不 能 问 海豚 问题 ， 所 以 关注 海豚 的 研究 人 员 不 得 不 通过 观察 其 行为 的 
方式 来 了 解 这 一 物种 。 而 研究 人 类 则 相对 容易 一 些 ， 因 为 人 类 会 说 话 。 与 
人 交谈 在 过 去 是 社会 研究 的 一 个 重要 组 成 部 分 ， 我 希望 将 来 也 是 如 此 。 


在 社会 研究 中 ， 与 人 交谈 通常 有 两 种 形式 : 调查 和 深度 访谈 。 简 单 来 说 , 
通过 调查 进行 的 研究 需要 系统 地 招募 大 量 参 与 者 ， 需 要 高 度 结构 化 的 调查 
问卷 以 及 使 用 统计 方法 实现 从 参与 者 到 更 大 群体 的 泛 化 。 而 通过 深度 访谈 
进行 的 研究 则 通常 需要 少量 的 参与 者 和 半 结 构 化 的 对 话 ， 最 终 得 出 关于 参 
与 者 的 丰富 的 定性 描述 。 调 查 和 深度 访谈 都 是 很 有 效 的 方法 ， 但 从 模拟 时 
代 到 数字 时 代 的 转变 对 调查 的 影响 更 大 。 因 此 ， 在 本 章 中 ， 我 将 重点 介绍 
调查 研究 。 


本 章 将 向 大 家 展示 ， 数 字 时 代为 调查 研究 人 员 创 造 了 许多 令 人 兴奋 的 机 
会 ， 使 他 们 能 以 更 快 的 速度 、 更 低 的 成 本 搜集 数据 ， 能 提出 不 同类 型 的 问 
题 ， 并 能 利用 大 数据 资源 放大 调查 数据 的 价值 。 技 术 变 革 可 以 改变 调查 研 
究 已 经 不 是 新 鲜 事 了 。 大 约 在 1970 年 ， 电 话 这 一 新 通信 技术 的 诞生 也 引发 
了 一 场 类 似 的 变革 。 幸 运 的 是 ， 理 解 电话 如 何 改变 调查 研究 有 助 于 我 们 预 
测 数字 时 代 将 如 何 改变 调查 研究 。 


今天 我 们 所 认可 的 调查 研究 起 源 于 20 世 纪 30 年 代 。 在 调查 研究 的 第 一 个 时 
代 ， 研 究 人 员 会 随机 选取 地 理 区 域 ( 如 城市 街区 ) ， 然 后 前 往 这 些 地 区 ， 
与 随机 选取 的 住户 进行 面对面 的 交谈 。 之 后 ， 固 定 电 话 开 始 在 一 些 富裕 国 
家 大 量 涌现 ， 这 一 技术 发 展 最 终 促使 调查 研究 进入 了 第 二 个 时 代 。 在 该 时 
代 ， 无 论 是 人 们 被 选 为 样本 的 方式 还 是 对 话 发 生 的 方式 都 发 生 了 改变 。 研 
究 人 员 不 再 选取 某 地 理 区 域 的 住户 作为 样本 ， 而 是 通过 一 个 随机 拨号 的 程 
序 随机 选取 电话 号 码 作为 样本 。 他 们 也 不 再 前 往 当地 和 人 们 面对面 交谈 
了 ， 而 是 通过 打 电 话 来 交流 。 这 些 看 似 很 小 的 组 织 实施 上 的 变化 却 让 调查 
研究 变 得 更 快 、 成 本 更 低 、 更 加 灵活 。 除 了 这 些 益处 之 外 ， 这 些 变 化 也 引 
发 了 争议 ， 因 为 许多 研究 人 员 担 心 这 些 取样 和 访谈 方式 的 改变 会 导致 各 种 
偏差 。 但 最 终 ， 在 大 量 工 作 之 后 ， 研 究 人 员 找 到 了 通过 随机 拨号 和 电话 访 
谈 搜集 可 靠 数据 的 方法 。 因 此 ， 成 功 借助 了 社会 上 的 技术 基础 设施 ， 研 究 
人 员 能 以 现代 化 的 方式 进行 调查 研究 了 。 


现在 ， 另 一 项 技术 发 展 一 一 数字 技术 ， 最 终 将 带领 我 们 进入 调查 研究 的 第 
三 个 时 代 。 这 一 转变 的 部 分 原因 是 第 二 个 时 代 的 方法 逐渐 不 再 适用 了 
(Meyer, Mok, and Sullivan 2015 ) 。 例 如 ， 由 于 各 种 技术 和 社会 原因 ， 
多 年 来 无 回答 率 ( 即 样本 中 未 参与 调查 的 受 访 者 的 比例 ) 一 直 在 上 升 


(National Research Council 2013 ) 。 这 一 长 期 趋势 意味 着 ， 如 果 现 在 开 
展 电 话 调查 ， 那 么 无 回答 率 会 超过 90%。 

另 一 方面 ， 向 第 三 个 时 代 的 过 渡 在 部 分 程度 上 也 受到 了 令 人 兴奋 的 新 机 会 
的 推动 ， 我 将 在 本 章 对 其 中 一 些 机 会 进行 描述 。 尽 管 目前 还 没有 定论 ,但 
我 预计 非 概率 抽样 、 计 算 机 管理 的 调查 以 及 使 用 大 数据 资源 进行 调查 ， 将 
成 为 调查 研究 第 三 个 时 代 的 特征 ( 表 3.1 ) 。 

表 3.1 调查 研究 的 三 个 时 代 

抽样 访谈 数据 环境 


区 域 概率 抽样 面对面 调查 单独 调查 


随机 拨号 概率 抽样 电话 调查 单独 调查 


使 用 大 数据 资源 


非 概率 抽样 计算 机 管理 的 调查 Se 
进行 调查 


调查 研究 第 二 个 时 代 和 第 三 个 时 代 之 间 的 过 渡 并 不 是 一 帆 风 顺 的 ， 关 于 研 
究 人 员 应 如 何 继续 开展 调查 研究 ， 一 直 存 在 激烈 的 争论 。 回 顾 第 一 个 时 代 
和 第 二 个 时 代 之 间 的 过 渡 ， 我 认为 对 今天 的 我 们 来 说 ， 很 关键 的 一 个 经 验 
是 : 开始 并 不 是 结束 。 也 就 是 说 ， 在 第 二 个 时 代 ， 许 多 基于 电话 的 方法 起 
初 都 是 临时 决定 的 ， 而 且 也 不 太 有 效 。 但 经 过 努力 ， 研 究 人 员 解 决 了 这 些 
问题 。 例 如 ， 在 起 初 的 许多 年 里 ， 研 究 人 员 一 直 在 摸索 随机 拨号 ， 然 后 才 
产生 了 沃 伦 . 米 托 夫 斯 基 (Warren Mitofsky ) 和 约瑟夫 . 韦 克 斯 伯 格 
(Joseph Waksberg ) 具有 良好 实用 性 和 理论 基础 的 随机 拨号 抽样 法 

( Waksberg 1978; Brick and Tucker 2007 ) 。 因 此 ， 我 们 不 应 该 认为 第 
三 个 时 代 的 方法 在 当前 的 状态 就 是 其 最 终 状 态 。 


调查 研究 的 发 展 历程 表明 ， 这 一 领域 的 发 展 是 由 技术 和 社会 的 变化 所 驱动 
的 ， 我 们 无 法 阻止 这 一 发 展 。 我 们 应 该 欣然 接受 这 一 发 展 ， 并 继续 从 之 前 
的 时 代 汲 取 智 慧 ， 这 也 是 我 在 本 章 将 遵循 的 理念 。 首 先 ， 我 认为 大 数据 资 
源 不 会 取代 调查 ， 而 且 其 丰富 性 还 会 提升 而 不 是 降低 调查 的 价值 ( 3.2 

节 ) 。 鉴 于 这 一 点 ， 我 将 总 结 在 调查 研究 的 前 两 个 时 代 发 展 起 来 的 调查 误 
差 总 框 染 ( 3.3 节 ) 。 该 框 染 能 让 我 们 了 解 有 关 代 表 性 的 新 方法 ， 尤 其 是 
非 概率 样本 (3.4 节 ) 以 及 测量 的 新 方法 ， 特 别 是 向 受 访 者 提问 的 新 方法 
( 3.5 节 ) 。 最 后 ， 我 将 描述 两 个 将 调查 数据 和 大 数据 资源 结合 起 来 的 研 
究 模板 ( 3.6 节 ) 。 


File does not exist 


File does not exist 


File does not exist 


3.5 提问 的 新 方法 


传统 的 调查 是 不 公开 的 、 无 聊 的 ， 并 且 远 离 生活 。 而 如 今 ， 我 们 可 以 问 一 
些 更 开放 、 更 有 趣 、 更 贴近 生活 的 问题 。 


调查 误差 总 框架 促使 研究 人 员 将 调查 研究 作为 一 个 由 两 部 分 组 成 的 过 程 来 
思考 ， 这 两 个 部 分 分 别 是 招募 受 访 者 和 向 他 们 提问 。 在 3.4 节 中 ， 我 介绍 
了 数字 时 代 是 如 何 改变 我 们 招募 受 访 者 的 方式 的 ， 而 现在 我 将 介绍 数字 时 
代 如 何 让 研究 人 员 能 以 新 的 方法 来 提问 。 这 些 新 方法 可 以 被 用 于 概率 样本 
或 非 概率 样本 。 


调查 方式 是 关于 问题 传递 的 方式 或 渠道 的 ， 它 对 测量 有 重要 的 影响 
(Couper 2011 ) 。 在 调查 研究 的 第 一 个 时 代 ， 最 常见 的 方式 是 面对面 ， 
而 在 第 二 个 时 代 ， 则 是 电话 。 有 些 研究 人 员 将 调查 研究 的 第 三 个 时 代 看 作 
仅仅 是 调查 方式 的 增加 ， 新 增 了 计算 机 和 手机 。 然 而 数字 时 代 不 仅仅 意味 
着 问题 和 答案 传递 渠道 的 改变 ， 从 模拟 到 数字 的 转变 使 研究 人 员 能 够 改变 
其 提问 的 方式 。 


迈克 尔 : 肖 伯 ( Michael Schober ) 和 同事 的 一 项 研究 可 以 说 明 调 整 传统 方 
法 以 使 其 更 好 地 匹配 数字 时 代 通 信 系 统 的 好 处 。 在 这 项 研究 中 ， 肖 伯 和 同 
事 比较 了 几 种 不 同 的 利用 手机 向 受 访 者 提问 的 方法 。 其 中 一 种 是 语音 会 
话 ， 该 方法 可 以 说 是 调查 研究 第 二 个 时 代 方 法 的 延伸 ; 另 一 种 是 通过 短信 
发 送 的 微观 调查 ， 该 方法 没有 什么 广为人知 的 先例 。 然 后 他 们 发 现 ， 相 比 
于 语音 会 话 ， 通 过 短信 发 送 的 微观 调查 能 搜集 到 质量 更 高 的 数据 。 换 句 话 
说 ， 只 是 简单 地 用 新 媒介 来 实施 旧 方 法 ， 是 无 法 搜集 到 最 高 质量 的 数据 
的 。 相 反 ， 通 过 清楚 地 思考 手机 相关 的 功能 和 社会 规范 ， 肖 伯 和 同事 找到 
了 一 种 更 好 的 提问 方式 ， 进 而 搜集 到 了 更 高 质量 的 答案 。 


研究 人 员 可 以 从 多 个 维度 对 调查 方式 进行 分 类 ， 但 我 认为 数字 时 代 调 查 方 
式 最 主要 的 特征 是 通过 计算 机 管理 ， 而 不 是 由 采访 者 管理 ( 例如 电话 和 面 
对 面 访谈 调查 ) 。 采 访 者 不 参与 数据 采集 过 程 有 诸多 好 处 ， 这 同时 带 来 了 
一 些 挑战 。 就 好 处 而 言 ， 采 访 者 不 参与 数据 采集 可 以 减少 社会 期 望 偏差 ， 

而 社会 期 望 偏差 会 使 受 访 者 倾向 于 以 最 好 的 方式 来 呈现 自己 ， 例 如 谎 称 自 
己 没有 做 过 滥用 药物 等 被 社会 污 名 化 的 行为 ， 或 谎 称 自己 做 过 投票 等 被 提 
倡 的 行为 ( Kreuter, Presser, and Tourangeau 2008 ) 。 采 访 者 不 参与 数据 
采集 还 能 消除 采访 者 的 影响 ， 即 采访 者 的 某 些 特点 倾向 于 以 微妙 的 方式 影 
响 受 访 者 的 答案 ( West and Blom 2016 ) 。 除 了 可 能 提高 某 类 问题 答案 的 
准确 度 以 外 ， 采 访 者 不 参与 数据 采集 还 能 大 大 降低 成 本 ( 访谈 时 间 是 调查 
研究 中 最 大 的 成 本 之 一 ) ， 并 且 增 加 了 灵活 性 ( 受 访 者 可 以 按 自 己 的 意愿 


随时 参与 调查 ， 而 不 是 受制 于 采访 者 的 时 间 ) 。 就 挑战 而 言 ， 如 果 调 查 是 
采访 者 管理 的 ， 那 么 采访 者 可 以 与 受 访 者 建立 良好 的 关系， 进而 提高 参与 
率 ， 同 时 对 受 访 者 不 理解 的 问题 还 能 给 予 解释 。 对 于 问题 特别 多 的 调查 问 
6 ( 可 能 会 很 乏味 ) ， 采 访 者 还 可 以 保证 受 访 者 的 完成 度 ( Garbarski, 
Schaeffer, and Dykema 2016 ) 。 因 此 ， 从 采访 者 管理 的 调查 方式 到 计算 
机 管理 的 调查 方式 ， 这 种 转变 既 带 来 了 机 遇 也 带 来 了 挑战 。 


接 下 来 ， 我 将 介绍 两 种 提问 的 方法 ， 表 明 研 究 人 员 如 何 借助 数字 时 代 的 工 
具 以 不 同 的 方式 发 问 : 用 来 在 更 合适 的 时 间 和 地 点 测量 内 部 状态 的 生态 瞬 
时 评估 法 (3.5.1 小 节 ) 以 及 结合 了 开放 式 问 题 和 封闭 式 问 题 优点 的 维基 调 
查 (3.5.2 小 节 ) 。 然 而 ， 由 计算 机 管理 的 、 不 受 地 点 限制 的 提问 方式 的 出 
现 ， 也 意味 着 我 们 需要 设计 出 受 访 者 更 喜欢 的 提问 方式 ， 这 一 过 程 有 时 被 
称 为 游戏 化 (3.5.3 小 节 ) 。 


3.5.1 生态 瞬时 评估 法 
研究 人 员 可 以 分 解 大 型 的 调查 ， 然 后 将 其 融入 人 们 的 生活 。 


生态 瞬时 评估 法 将 传统 的 调查 分 解 ， 然 后 将 其 融入 参与 者 的 生活 。 因 此 , 
研究 人 员 可 以 在 合适 的 时 间 和 地 点 进行 提问 ， 而 不 是 在 事情 发 生 数 周 后 才 
通过 一 个 长 时 间 的 访谈 来 了 解 。 


生态 瞬时 评估 法 主要 有 4 个 特征 : (1) 在 现实 环境 中 搜集 数据 ; (2 ) 评 

估 的 是 个 体 当 前 或 最 近 的 状态 或 行为 ; (3) 评估 可 能 是 基于 事件 的 、 基 

于 时 间 的 或 随机 引发 的 〈 取决 于 研究 问题 ; (4) 随 着 时 间 的 推移 需 进 

行 多 次 评估 (Stone and Shiffman 1994 ) 。 一 天 中 人 们 可 以 不 断 通 过 智能 
手机 进行 交流 ， 这 大 大 提高 了 生态 瞬时 评估 法 的 便利 性 。 此 外 ， 智 能 手机 
上 装 有 各 种 传感器 ， 例 如 GPS (全 球 定位 系统 ) 和 加 速 计 ， 因 此 研究 人 员 

可 以 通过 用 户 的 活动 情况 启动 相应 的 测量 。 例 如 ， 可 将 以 智能 手机 设置 为 
当 受 访 者 进入 某 特定 街区 时 便 向 其 提 一 个 调查 问题 。 


内 奥 米 - 杉 江 ( Naomi Sugie ) 的 研究 可 以 很 好 地 说 明生 态 瞬 时 评估 法 的 前 
景 。 自 20 世 纪 70 年 代 以 来 ， 美 国 的 监禁 人 数 开始 急剧 上 升 。 截 至 2005 
年 ， 每 10 万 美国 人 中 就 有 约 500 人 在 狱 中 ， 这 一 比例 要 高 于 世界 上 其 他 任 
何 地 方 (Wakefield and Uggen 2010 ) 。 入 狱 人 数 的 激增 也 导致 了 出 狱 人 
数 的 激增 ， 每 年 约 有 70 万 人 出 狱 (Wakefield and Uggen 2010 ) 。 这 些 人 
出 狱 后 面临 着 严峻 的 挑战 ， 不 幸 的 是 ， 许 多 人 最 后 又 回 到 了 监狱 。 为 了 了 
解 和 减少 累犯 ， 社 会 科学 家 和 决策 者 需要 了 解 这 些 人 重新 进入 社会 后 的 经 
历 。 然 而 ， 这 些 数据 很 难 用 标准 的 调查 方法 来 搜集 ， 因 为 这 些 曾 经 是 罪犯 
的 人 往往 是 很 难 了 解 的 ， 而 且 他 们 的 生活 非常 不 稳定 。 每 隔 几 个 月 进行 一 
次 调查 的 测量 方法 会 遗漏 掉 他 们 生活 中 大 量 的 动态 (Sugie 2016), 


为 了 更 精确 地 研究 他 们 重新 进入 社会 的 过 程 ， 杉 江 从 新 泽 西 州 纽 瓦 克 市 所 
有 出 狱 的 人 中 抽取 了 一 个 131 人 的 标准 概率 样本 。 她 为 样本 中 的 每 位 参与 
者 提供 了 一 部 智能 手机 ， 进 而 创建 了 一 个 既 可 以 记录 行为 又 可 以 提问 的 丰 
富 的 数据 采集 平台 。 杉 江 利 用 手机 开展 了 两 类 调查 。 首 先 ， 她 在 上 午 9 点 
和 下 午 6 点 之 间 随 机 选 了 一 个 时 间 向 参与 者 发 送 “ 体 验 抽样 调查 ”, 询问 参 
与 者 当下 的 活动 和 感受 。 然 后 ， 在 晚上 7 点 ， 她 会 向 参与 者 发 送 一 个 “每 日 
调查 ”, 询问 他 们 当天 的 所 有 活动 。 除 了 这 些 调查 问题 以 外 ， 手 机 还 会 定 
期 记录 他 们 的 地 理 位 置 ， 并 以 加 密 的 方式 记录 有 关 打 电话 和 发 短信 的 元 数 
据 。 通 过 将 提问 与 观察 相 结 合 ， 杉 江 获 得 了 这 些 人 重新 进入 社会 后 详细 
的 、 高 频 的 测量 数据 。 


研究 人 员 相 信 ， 找到 稳定 的 、 高 质量 的 工作 有 助 于 人 们 成 功 地 重 返 社会 。 
然而 ， 杉 江 发 现 ， 平 均 来 说 ， 其 研究 参与 者 找到 的 工作 都 是 非 正 式 的 、 临 
时 的 和 零散 的 ， 但 该 平均 描述 掩盖 了 重要 的 异 质 性 。 杉 江 在 其 样本 中 发 现 
了 4 个 完全 不 同 的 群体 :“ 早 期 退出 ”( 最 开始 找 过 工作 ， 但 后 来 退出 了 劳 
动力 市 场 ) 、“ 持 续 寻 找 ”( 融入 社会 前 的 大 部 分 时 间 都 花 在 找 工作 

上 )、“ 循 环 工作 ”( 融入 社会 前 的 大 部 分 时 间 都 花 在 工作 上 ) 以 及 “ 低 响 
应 ”( 不 会 定期 回答 调查 问题 ) 。 其 中 “早期 退出 ”这 一 群体 最 开始 找 过 工 
作 ， 但 后 来 没 找到 就 放弃 了 ， 该 群体 尤其 重要 ， 因 为 他 们 可 能 是 成 功 融 入 
社会 概率 最 低 的 群体 。 


人 们 可 能 会 认为 ， 出 狱 后 找 工 作 是 一 个 很 艰难 的 过 程 ， 这 些 人 可 能 会 因为 
泪 丧 而 退出 芳 动 力 市 场 。 因 此 ， 杉 江 通 过 她 的 调查 还 搜集 了 有 关 参 与 者 情 
绪 状 态 ( 一 种 通过 行为 数据 难以 评估 出 来 的 内 部 状态 ) 的 数据 。 令 人 惊讶 
的 是 “早期 退出 ”这 一 群体 并 没有 称 自 己 压力 过 大 或 过 于 悲伤 ， 反 倒是 那 
些 失 败 后 继续 找 工作 的 人 称 自 己 过 于 忧虑 悲伤 。 所 有 这 些 有 关 出 狱 人 员 行 
为 和 情绪 状态 的 细微 的 、 纵 向 的 详细 数据 ， 对 于 理解 他 们 所 面临 的 阻碍 以 
及 降低 他 们 重 返 社会 的 难度 有 着 重要 意义 。 但 如 果 使 用 标准 的 调查 ， 这些 
细微 的 数据 就 会 被 遗漏 。 


杉 江 的 数据 采集 针对 的 是 一 个 弱势 群体 ， 其 数据 采集 方式 可 能 会 引发 一 些 
道德 伦理 方面 的 担忧 。 但 杉 江 预先 就 考虑 到 了 这 些 担忧 ， 并 在 设计 过 程 中 
采取 了 应 对 措施 ( Sugie 2014, 2016 ) 。 她 所 在 大 学 的 机 构 审 查 委员 会 作 
为 第 三 方 审查 了 她 的 数据 采集 程序 ， 认 为 该 程序 符合 所 有 现存 规则 。 此 
外 ， 杉 江 的 方法 与 我 在 第 6 章 所 提倡 的 基于 原则 的 方法 相 一 致 ， 在 符合 现 
有 法 规 方面 远 远 超出 了 要 求 的 范围 。 例 如 ， 她 获得 了 所 有 参与 者 的 知情 同 
意 ， 这 是 很 有 意义 的 ， 她 还 同意 参与 者 暂时 关闭 位 置 追踪 ， 并 且 竭 尽 全 力 
去 保护 她 所 搜集 的 数据 。 除 了 采用 适当 的 加 密 技 术 和 数据 存储 外 ， 她 还 申 
请 并 获得 了 联邦 政府 的 保密 证 书 ， 这 意味 着 她 不 会 被 迫 将 数据 交 给 警察 
(Beskow, Dame, and Costello 2008 ) 。 因 为 考虑 周全 ， 所 以 我 认为 杉 江 


的 项 目 给 其 他 研究 人 员 提 供 了 一 个 有 价值 的 参考 。 尤 其 是 她 没有 不 加 思考 
就 行动 而 让 自己 陷入 道德 伦理 的 泥潭 ， 也 没有 因为 道德 伦理 上 的 复杂 性 而 
回避 重要 的 研究 。 相 反 ， 她 仔细 思考 ， 和 寻求 合理 建议 ,尊重 她 的 参与 者 ， 
并 采取 措施 降低 其 研究 的 风险 、 增 加 研究 的 益处 。 


我 认为 从 杉 江 的 研究 中 可 以 学 到 以 下 三 点 : 首先 ， 提 问 的 新 方法 与 传统 的 
抽样 法 是 完全 相 容 的 ， 杉 江 就 是 从 定义 明确 的 抽样 框 总 体 中 抽取 了 一 个 标 
准 的 概率 样本 。 其 次 ， 高 频 、 纵 向 的 测量 数据 对 于 研究 不 规则 的 、 动 态 的 
社会 经 历 是 很 有 价值 的 。 最 后 ， 当 调查 数据 采集 与 大 数据 资源 相 结 合 时 

( 我 认为 这 会 越 来 越 常见 ， 我 将 在 本 章 后 面部 分 进行 论述 ) ， 就 可 能 引发 
额外 的 道德 伦理 问题 。 我 将 在 第 6 章 更 详细 地 探讨 研究 中 的 伦理 问题 ， 但 
杉 江 的 事例 表明 ， 细 心 负责 、 考 虑 周密 的 研究 人 员 是 可 以 解决 这 些 问题 
的 。 


3.5.2 维基 调查 

维基 调查 为 封闭 式 问 题 和 开放 式 问 题 的 结合 提供 了 新 的 可 能 。 

除了 能 让 我 们 在 更 合适 的 时 间 和 更 自然 的 环境 中 进行 提问 ， 新 技术 还 让 我 
们 能 够 改变 问题 的 形式 。 大 多 数 调 查 问 题 都 是 封闭 的 ， 受 访 者 只 能 从 研究 
人 员 给 定 的 几 个 选项 中 进行 选择 。 一 位 著名 的 调查 研究 人 员 称 该 过 程 
为 “将 单词 放 入 人 们 的 口中 ”。 例如， 以 下 就 是 一 个 封闭 的 调查 问题 : 


下 面 一 道 题 是 有 关 工 作 的 。 请 看 这 些 条 目 ， 你 能 告诉 我 以 下 哪 一 项 是 你 在 
一 份 工作 中 最 看 重 的 吗 ? 


1. 高 薪酬 ; 

2. 没 有 被 解雇 的 危险 ; 

3. 工 作 时 间 短 ， 有 很 多 空闲 时 间 ; 
4. 晋 升 机 会 ， 


5. 这 份 工作 是 很 重要 的 ， 给 人 一 种 成 就 感 。 


但 这 些 是 全 部 可 能 的 答案 吗 ? 研究 人 员 将 答案 限制 在 这 5 个 选项 中 会 不 会 
遗漏 了 一 些 重要 的 东西 呢 ? 与 封闭 式 问 题 相对 应 的 是 开放 式 问 题 ， 以 下 是 
以 开放 的 形式 对 同一 个 问题 进行 提问 : 


下 面 一 道 题 是 有 关 工 作 的 。 对 于 工作 ， 人 们 追寻 的 是 不 同 的 东西 。 那 你 在 
一 份 工作 中 最 看 重 的 是 什么 呢 ? 


尽管 这 两 个 问题 看 起 来 很 相似 ， 但 霍华德 . 舒 曼 (Howard Schuman ) 和 斯 
坦 利 . 普 雷 瑟 (Stanley Presser ) 的 一 项 调查 实验 表明 ， 它 们 可 以 产生 非常 
不 同 的 结果 : 近 60% 的 以 开放 方式 提问 而 搜集 到 的 答案 ， 都 不 在 研究 人 员 
给 定 的 选项 中 (图 3.9 ) 。 


你 在 一 份 工作 中 最 看 重 的 是 什么 呢 ? 
封闭 式 问题 ” ”| 开放 式 问 题 


成 就 感 
晋升 
薪酬 
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图 3.9 一 项 调查 实验 的 结果 表明 ， 采 用 封闭 的 方式 提问 与 采用 开放 的 方式 
提问 所 搜集 到 的 答案 不 一 样 。 改 编 自 Schuman and Presser (1979 ) ， 表 
1, 


尽管 开放 式 问 题 和 封闭 式 问 题 可 以 产生 完全 不 同 的 信息 ， 而 且 两 种 形式 的 
问题 在 调查 研究 的 早期 都 很 受 欢 迎 ， 现 在 处 于 主导 地 位 的 却 是 封闭 式 问 
题 。 这 并 不 是 因为 封闭 式 问 题 被 证 明 能 产生 更 好 的 测量 数据 ， 而 是 因为 封 
闭 式 问题 使 用 起 来 要 简单 很 多 ， 因 为 分 析 开 放 式 问题 的 过 程 易 于 出 错 且 成 
本 高 昂 。 研 究 人 员 逐 渐 不 再 采用 开放 式 问 题 ， 这 真是 令 人 遗憾 ， 因 为 正 是 
那些 研究 人 员 事 先 不 知道 的 信息 才 是 最 有 价值 的 信息 。 


然而 ， 从 人 类 管理 的 调查 到 计算 机 管理 的 调查 ， 这 一 转变 为 这 个 老 问 题 找 
到 了 一 个 新 的 解决 办 法 。 如 果 我 们 现在 能 设计 出 融合 了 开放 式 问 题 和 封闭 
式 问 题 各 自 优点 的 调查 问题 ， 会 怎么 样 呢 ? 也 就 是 说 ， 如 果 我 们 的 调查 既 
能 搜集 到 新 的 信息 又 能 保证 答案 易于 分 析 ， 会 怎么 样 呢 ? 这 正 是 卡 伦 - 利 维 


(Karen Levy ) 和 我 已 着 手 想 要 实现 的 。 


具体 而 言 ， 卡 伦 和 我 认为 ， 搜 集 和 管理 用 户 生 成 内 容 的 网 站 可 能 会 影响 新 
型 调查 的 设计 。 尤 其 是 维基 百科 ( 内 容 主 要 由 用 户 生 成 的 动态 开放 系统 的 
绝 佳 案例 ) ， 它 让 我 们 很 受 启发 ， 因 此 我 们 称 这 个 新 型 调查 为 维基 调查 。 

正如 维基 百科 会 基于 参与 者 的 想法 逐步 发 展 ， 我 们 也 设想 了 一 个 会 基于 参 
与 者 想法 而 逐步 发 展 的 调查 。 卡 伦 和 我 认为 ， 维 基调 查 应 满足 三 个 特性 : 
贪 梦 性 、 协 作 性 和 适应 性 。 然 后 ， 我 们 和 一 组 网 站 开发 人 员 一 起 创建 了 一 
个 可 以 开展 维基 调查 的 网 站 : http://www.allourideas.org。 


我 们 可 以 通过 与 纽约 市 长 办 公 室 共同 开展 的 一 个 项 目 来 了 解 维基 调查 的 数 
据 采 集 过 程 。 该 项 目 旨 在 将 居民 的 想法 整合 到 纽约 市 可 持续 发 展 规划 中 
去 。 首 先 ， 市 长 办 公 室 根 据 他 们 之 前 的 外 展 服务 〈 例如“ 要求 所 有 大 型 建 
筑 都 要 进行 一 定 的 能 效 升级 ”以 及 “把 教 孩 子 环保 知识 作为 学 校 课 程 的 一 部 
分 ”) 列 出 了 25 个 想法 ， 以 此 作为 这 样 一 个 问题 的 备 选 答案 : 你 认为 哪 一 
项 更 有 利于 创建 一 个 更 环保 的 、 更 好 的 纽约 市 ? 然后 ， 计算机 会 随机 从 备 
选 答案 中 抽取 2 个 〈 例如 “开放 纽约 市 所 有 学 校 的 操场 作为 公共 体育 

场 ? 和 "增加 哮喘 发 病 率 高 的 社区 的 植树 量 ” ) ， 供 受 访 者 选择 ( 图 3.10 ) 。 
受 访 者 做 出 选择 后 ， 计 算 机 会 立即 再 随机 抽取 2 个 想法 供 其 选择 。 
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图 3.10 一 个 维基 调查 的 界面 。 图 左 是 回答 界面 ， 图 右 是 结果 界面 。 经 允 
许 转 载 自 Salganik and Levy (2015) ， 图 2。 


只 要 受 访 者 愿意 ， 通 过 二 选 一 或 选择 “我 无 法 决定 ”, 受 访 者 可 以 一 直 回 答 
他 更 偏向 于 哪 种 方案 。 最 重要 的 是 ， 受 访 者 可 以 在 任何 时 候 贡 献 他 们 自己 
的 想法 ， 这 些 想 法 经 过 市 长 办 公 室 的 同意 后 ， 可 以 作为 备 选 答案 呈现 给 其 
他 受 访 者 。 因 此 ， 受 访 者 回答 的 问题 既是 开放 的 又 是 封闭 的 。 

为 了 搜集 居民 的 反馈 信息 ， 市 长 办 公 室 于 2010 年 10 月 启动 了 该 维基 调 


查 ， 同 时 还 开展 了 一 系列 的 社区 会 谈 。 在 大 约 4 个 月 的 时 间 里 ，1436 名 受 
访 者 贡献 了 31893 个 答案 以 及 464 个 新 想法 。 至 天 重要 的 是 ， 前 10 个 最 受 


欢迎 的 想法 中 有 8 个 是 受 访 者 提出 来 的 ， 而 不 是 源 于 市 长 办 公 室 起 初 列 出 
的 25 个 想法 。 并 且 ， 正 如 我 们 在 论文 中 所 描述 的 那样 ， 受 访 者 贡献 的 想法 
比 研究 人 员 给 定 的 想法 更 受 欢 迎 的 现象 在 许多 维基 调查 中 都 出 现 过 。 换 名 
话说 ， 通 过 允许 受 访 者 贡献 自己 的 想法 ， 研 究 人 员 能 够 了 解 到 更 多 的 信 
息 ， 而 这 些 信息 在 使 用 更 封闭 的 方法 进行 调查 时 可 能 会 被 遗漏 掉 。 


除了 这 些 具体 调查 的 结果 以 外 ， 我 们 的 维基 调查 项 目 还 展示 了 数字 研究 的 
成 本 结构 是 如 何 让 研究 人 员 能 以 不 同 的 方式 接触 世界 的 。 现 在 ， 学 术 研 究 

员 能 够 创建 可 供 许多 人 使 用 的 真实 系统 : 我 们 已 经 主办 了 超过 10000 项 
维基 调查 ， 搜 集 了 1500 多 万 份 答案 。 这 种 创造 可 以 大 规模 使 用 的 东西 的 能 
力 源 于 这 样 一 个 事实 : 一 旦 一 个 网 站 建立 起 来 了 ， 那 么 让 世界 上 的 每 个 人 
都 免费 使 用 它 基本 上 不 会 再 产生 成 本 ( 当然， 如果 我 们 采取 由 人 类 管理 的 
访谈 ， 就 无 法 实现 这 一 点 ) 。 此 外 ， 这 样 的 规模 可 以 使 研究 人 员 开 展 不 同 
类 型 的 研究 。 例 如 ， 这 1500 多 万 份 答案 以 及 大 量 的 参与 者 为 未 来 的 方法 研 
究 提供 了 一 个 宝贵 的 测试 场 。 在 第 4 章 介绍 实验 时 我 将 进一步 描述 数字 时 
代 成 本 结构 (尤其 是 成 本 不 会 随 着 所 搜集 数据 量 的 增加 而 增加 ) 所 创造 的 
其 他 研究 机 会 。 


3.5.3 游戏 化 
标准 调查 对 参与 者 来 说 是 很 无 聊 的 。 这 种 情况 可 以 改变 ， 而 且 必 须 改变 。 


到 目前 为 止 ， 我 已 经 向 大 家 介绍 了 一 些 新 的 提问 方法 ， 而 计算 机 管理 的 调 
查 则 对 这 些 方 法 的 出 现 起 到 了 促进 作用 。 但 计算 机 管理 的 调查 也 有 一 个 缺 
点 ， 那 就 是 没有 一 个 采访 者 来 帮助 诱导 和 保持 受 访 者 的 参与 度 。 这 之 所 以 
成 为 一 个 问题 ， 是 因为 许多 调查 既 费 时 又 枯燥 。 因 此 ， 在 未 来 ， 调 查 设计 
者 在 设计 过 程 中 将 不 得 不 考虑 参与 者 的 想法 ， 以 便 使 回答 问题 的 过 程 更 愉 
快 、 更 像 游戏 。 这 一 过 程 有 时 被 称 为 游戏 化 。 


我 将 通过 “朋友 感觉 ” ( Friend Sense ) 这 项 调查 来 说 明 怎样 才 可 能 做 出 一 

项 有 趣 的 调查 。 该 调查 是 在 脸谱 网 上 进行 的 ， 看 起 来 像 是 一 个 游戏 。 沙 拉 
德 : 戈 埃 尔 、 温 特 -梅森 ( Winter Mason ) 和 邓肯 : 瓦 次 旨 在 通过 这 项 调查 来 
评估 人 们 认为 自己 与 朋友 有 多 相似 ， 以 及 实际 上 与 朋友 有 多 相似 。 这 个 有 
关 真 实 的 态度 相似 度 和 感知 的 态度 相似 度 的 问题 ， 可 以 直接 反映 人 们 精确 
感知 自己 社交 环境 的 能 力 ， 并 对 政治 极 化 和 社会 变化 的 动态 产生 影响 。 从 
概念 上 讲 ， 真 实 的 态度 相似 度 和 感知 的 态度 相似 度 是 很 容易 测量 的 。 研 究 
人 员 可 以 就 某 方面 的 观点 向 人 们 提问 ， 然 后 再 问 他 们 的 朋友 ( 这 样 可 以 测 
得 真实 的 态度 相似 度 ) ， 也 可 以 让 人 们 猜 其 朋友 的 态度 ( 这样 可 以 测 得 感 
知 的 态度 相似 度 ) 。 但 可 惜 的 是 ， 既 采访 受 访 者 又 采访 其 朋友 ， 实 施 起 来 
特别 困难 。 因 此 ， 戈 埃 尔 和 同事 把 他 们 的 调查 变 成 了 一 个 好 玩 的 脸谱 网 应 


用 程序 。 


在 一 位 参与 者 同意 参加 一 项 研究 后 ， 该 应 用 程序 会 从 该 参与 者 的 脸谱 网 中 
选择 一 位 好 友 ， 然 后 就 该 好 友 的 态度 向 参与 者 提问 〈 图 3.11 ) 。 在 回答 有 
天 随机 选择 的 朋友 的 问题 时 ， 该 参与 者 也 要 回答 有 关 自 己 的 问题 。 在 答 完 
有 关 一 个 朋友 的 问题 时 ， 系 统 会 告诉 该 参与 者 其 答案 是 否 正确 ， 如 果 该 参 
与 者 的 朋友 没有 作答 ， 该 参与 者 还 可 以 鼓励 他 作答 。 因 此 ， 这 项 调查 在 一 
定 程度 上 是 通过 病毒 式 招募 来 传播 的 。 


Would Sharad Goel go see the Spice Girls 
reunion tour if given free tickets? 


| Yes 


How welldo you know your friends? 
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图 3.11 “朋友 感觉 ?的 界面 (Goel Mason, and Watts 2010), MAAR 
把 标准 的 态度 调查 变 成 了 一 项 有 趣 的 、 类 似 游戏 的 体验 。 应 用 程序 向 参与 
者 提 的 问题 有 严肃 的 也 有 和 轻松 的 。 好 友 头 像 经 过 了 模糊 处 理 。 经 沙拉 德 : 戈 
埃 尔 允许 转载 。 


这 些 有 关 态 度 的 问题 改编 自 美国 综合 社会 调查 。 例 如 :“ 在 中 东 局 势 中 ， 
相 比 于 巴勒斯坦 人 ，( 你 的 朋友 ) 更 同情 以 色 列 人 是 吗 ? ”以 及 “( 你 的 朋 
友 ) 会 为 了 让 政府 能 够 提供 全 民 医保 而 缴 更 多 的 税 吗 ? "除了 这 些 严肃 的 
问题 以 外 ， 研 究 人 员 还 会 设置 更 轻松 的 问题 :“ 相 比 于 啤酒 ，(〈 你 的 朋 

友 ) 更 喜欢 葡萄 酒 是 吗 ? ”以 及 “( 你 的 朋友 ) 更 希望 拥有 读 心术 而 不 是 会 
飞 是 吗 ? "这些 更 轻松 的 问题 会 让 参与 者 觉得 这 个 过 程 很 有 趣 ， 同 时 也 让 
我 们 能 够 进行 一 项 有 趣 的 比较 : 参与 者 和 朋友 在 严肃 的 政治 问题 上 以 及 有 
天 喝酒 和 超 能 力 的 轻松 问题 上 的 态度 相似 度 会 基本 一 样 吗 ? 


这 项 研究 主要 得 出 了 三 个 结论 。 首 先 ， 相 比 于 陌生 人 人， 朋友 更 可 能 给 出 相 


同 的 答案 ， 但 即使 是 很 亲密 的 朋友 ， 也 在 约 30% 的 问题 上 持 不 同 的 观点 ; 
其 次 ， 参 与 者 往往 高 估 自 己 与 朋友 的 相似 度 ， 换 名 话说， 朋友 之 间 在 看 法 
上 的 大 多 数 差异 都 没有 被 注意 到 ; 最 后 ， 在 有 关 政治 的 严肃 问题 上 以 及 有 
天 喝酒 和 超 能 力 的 轻松 问题 上 ， 参 与 者 对 自己 与 朋友 在 看 法 上 的 差异 的 感 
知 基本 是 一 样 的 。 


尽管 这 款 应 用 程序 现在 已 经 不 能 再 玩 了 ， 但 它 很 好 地 说 明了 研究 人 员 如 何 
能 让 一 个 标准 的 态度 调查 变 得 有 趣 。 更 广泛 地 说 ， 通 过 一 些 创造 性 的 想法 
和 设计 工作 ， 研 究 人 员 就 有 可 能 改善 调查 参与 者 的 用 户 体验 。 因 此 ， 下 次 
你 设计 一 项 调查 时 ， 要 花 点 时 间 思 考 一 下 你 能 做 些 什 么 来 让 你 的 参与 者 感 
觉 更 好 。 有 些 人 可 能 会 担心 这 些 追 求 游戏 化 的 举措 会 影响 数据 质量 ， 但 我 
认为 ， 党 得 调查 无 聊 的 参与 者 对 数据 质量 的 影响 要 大 得 多 。 


成 埃 尔 和 同事 的 调查 研究 也 体现 了 下 一 节 的 主题 : 将 调查 与 大 数据 资源 结 
合 起 来 。 在 戈 埃 尔 和 同事 的 事例 中 ， 他 们 通过 将 调查 与 脸谱 网 结合 起 来 ， 
自动 获得 了 参与 者 的 好 友 列 表 。 在 下 一 节 中 ， 我 们 将 更 详细 地 探究 调查 与 
大 数据 资源 之 间 的 结合 。 


3.6 与 大 数据 资源 相 结 合 的 调查 


将 调查 与 大 数据 资源 结合 起 来 ， 能 让 你 得 出 单独 通过 调查 或 大 数据 资源 所 
无 法 得 出 的 评估 结论 。 


大 多 数 调查 都 是 独立 进行 的 。 它 们 没有 以 彼此 为 基础 ， 也 没有 借助 世界 上 
现 有 的 其 他 数据 。 这 种 现象 将 会 改变 。 将 调查 数据 与 第 2 章 介 绍 的 大 数据 
资源 结合 起 来 ， 我 们 将 得 到 更 多 益处 。 通 过 这 两 种 类 型 数据 的 结合 ， 我 们 
就 能 做 那些 只 通过 调查 数据 或 只 通过 大 数据 资源 不 可 能 做 到 的 事情 。 


将 调查 数据 与 大 数据 资源 结合 起 来 有 几 种 不 同 的 方法 。 在 本 节 中 ， 我 将 介 
绍 两 种 有 用 而 截然 不 同 的 方法 ， 我 称 它们 为 丰富 型 提问 和 扩充 型 提问 (图 
3.12 ) 。 虽 然 对 每 种 方法 我 都 将 通过 一 个 详细 的 事例 来 说 明 ， 但 大 家 应 该 
可 以 看 出 ， 这 两 种 方法 其 实 可 以 被 用 于 不 同类 型 的 调查 数据 和 不 同类 型 的 
大 数据 。 此 外 ， 大 家 还 应 注意 ， 这 两 个 事例 中 的 每 一 个 都 可 以 用 两 种 不 同 
的 视角 看 待 。 回 想 一 下 第 1 章 的 内 容 ， 有些 人 会 把 这 些 研究 看 作 “ 非 现 

成 ”调查 数据 增强 “现成 大 数据 的 事例 ， 而 其 他 人 则 会 把 它们 看 作 “ 现 成 ”大 
数据 增强 “ 非 现 成 ”调查 数据 的 事例 。 大 家 应 该 兼备 这 两 种 视角 。 最 后 ， 大 
家 要 注意 这 两 个 事例 如 何 说 明了 调查 数据 和 大 数据 资源 应 该 彼此 互补 而 不 


是 替代 。 
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‘ ! 调查 | 
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用 于 研究 


lisses 


用 于 研究 


图 3.12 两 种 将 大 数据 资源 和 调查 数据 结合 起 来 的 主要 方法 。 在 丰富 型 提 
问 〈3.6.1 小 节 ) 中 ， 大 数据 资源 中 含有 研究 人 员 感 兴趣 的 核心 数据 ， 而 调 
查 数据 围绕 该 大 数据 资源 构建 起 了 必要 的 背景 。 在 扩充 型 提问 (3.6.2//\ 
节 ) 中 ， 大 数据 资源 中 没有 研究 人 员 感 兴趣 的 核心 数据 ， 但 研究 人 员 可 以 
用 它 来 扩充 调查 数据 。 


3.6.1 丰富 型 提问 


在 丰富 型 提问 中 ， 大 数据 资源 含有 一 些 重要 的 测量 数据 ， 但 缺失 其 他 一 些 
测量 数据 ， 而 调查 数据 围绕 该 大 数据 资源 构建 起 了 必要 的 背景 。 


将 调查 数据 和 大 数据 资源 结合 起 来 的 一 种 方法 ， 我 称 之 为 丰富 型 提问 。 在 
丰富 型 提问 中 ， 大 数据 资源 中 含有 一 些 重要 的 测量 数据 ， 但 缺失 其 他 一 些 
测量 数据 ， 因 此 研究 人 员 需 要 通过 一 项 调查 来 搜集 这 些 缺 失 的 数据 ， 然 后 
将 两 部 分 数据 资源 结合 起 来 。 丰富 型 提问 的 一 个 事例 是 我 在 3.2 节 中 提 到 
的 伯 克 和 克 劳 特 针对 脸谱 网 上 的 互动 是 否 会 增进 友谊 所 开展 的 研究 。 在 该 
研究 中 ， 伯 克 和 克 劳 特 把 调查 数据 与 脸谱 网 的 日 志 数据 进行 了 结合 。 


然而 ， 伯 克 和 克 劳 特 当 时 的 工作 环境 意味 着 他 们 无 须 面 对 那 些 进 行 丰富 型 
提问 的 研究 人 员 通 常会 面临 的 两 大 难题 。 其 中 一 个 是 ， 如 果 两 个 数据 资源 
中 都 没有 可 用 来 确保 一 个 数据 集中 的 正确 记录 与 另 一 个 数据 集中 的 正确 记 


录 相 匹配 的 唯一 标识 符 ， 那 么 就 很 难 将 个 体 层 面 的 数据 集 链 接 起 来 ( 这 是 
一 个 被 称 为 记录 链接 的 过 程 ) 。 第 二 个 难题 是 ， 大 数据 资源 的 质量 通常 很 
难 评估 ， 因 为 数据 创建 的 过 程 可 能 是 不 对 外 公开 的 ， 并 且 大 数据 资源 容易 
受到 第 2 章 所 描述 的 问题 的 影响 。 换 句 话 说， 丰富 型 提问 经 常 需要 将 调查 
与 质量 未 知 的 黑匣子 似 的 数据 资源 链接 起 来 ， 而 这 一 过 程 很 容易 出 错 。 尽 
管 存在 这 些 问 题 ， 但 我 们 还 是 可 以 利用 丰富 型 提问 开展 重要 的 研究 ， 正 如 
斯 蒂 芬 - 安 索 拉 比 赫 (Stephen Ansolabehere ) 和 埃 坦 . 赫 什 〈Eitan 
Hersh ) 针对 美国 的 投票 模式 所 进行 的 研究 那样 。 


投票 率 一 直 是 大 量 政治 科学 研究 的 主题 ， 而 且 在 过 去 ， 研 究 人 员 对 于 谁 投 
票 以 及 为 什么 投票 的 理解 基本 上 都 基于 对 调查 数据 的 分 析 。 但 在 美国 ， 投 
票 是 一 种 非 比 寻 常 的 行为 ， 因 为 政府 会 记录 每 个 公民 是 否 投 票 。 ( 当然 ， 
政府 没有 记录 每 个 公民 把 票 投 给 了 谁 。 ) 多 年 来 ， 政 府 的 这 些 投票 记录 都 
是 纸 质 版 的 ， 分 散在 全 国 各 地 的 地 方 政府 办 公 室 中 。 这 使 政治 科学 家 很 难 
(但 也 不 是 不 可 能 ) 获得 全 体 选 民 的 投票 记录 ， 并 将 他 们 在 调查 中 关于 投 
票 所 说 的 内 容 和 实际 的 投票 行为 进行 比较 ( Ansolabehere and Hersh 
2012), 


但 这 些 投票 记录 现在 已 经 被 数字 化 了 。 通 过 系统 地 搜集 和 汇总 这 些 记 录 , 
一 些 私 人 公司 已 经 创建 了 包含 所 有 美国 人 投票 行为 的 全 面 主 投票 文件 。 安 
索 拉 比 赫 和 赫 什 就 选择 了 与 其 中 一 家 公司 Catalist ( 凯利 板 ) 合作 ， 以 利用 
其 主 投 票 文件 帮助 他 们 更 好 地 了 解 全 体 选民 。 此 外 ， 因 为 他 们 的 研究 依赖 
于 上 述 这 家 公司 ( 该 公司 在 数据 采集 和 汇总 方面 投入 了 大 量 的 资源 ) 所 搜 
集 和 管理 的 数字 记录 ， 所 以 他 们 现在 要 比 之 前 没有 公司 帮助 且 使 用 模拟 记 
录 开 展 研究 时 多 了 许多 优势 。 


像 第 2 章 的 许多 大 数据 资源 一 样 ， 安 索 拉 比 赫 和 赫 什 获得 的 主 投票 文件 中 
也 没有 太 多 他 们 所 需要 的 人 口 统计 、 态 度 以 及 行为 方面 的 信息 。 事 实 上 ， 
他 们 特别 感 兴趣 的 是 比较 调查 中 报告 的 投票 行为 和 经 过 验证 的 投票 行为 

( 即 Catalist 数 据 库 中 的 信息 ) 。 因 此 ， 安 索 拉 比 赫 和 赫 什 借助 本 章 前 面 提 
到 的 大 型 社会 调查 一 一 合作 国会 选举 研究 ， 搜 集 了 他 们 想 要 的 数据 。 然 
后 ， 他 们 把 搜集 来 的 数据 交 给 了 Catalist ，Catalist 汇 总 后 又 将 包括 经 验证 
的 投票 行为 ( 源 于 Catalist ) 、 自 我 报告 的 投票 行为 〈 源 于 合作 国会 选举 研 
À) 以 及 受 访 者 的 人 口 统计 资料 和 态度 在 内 的 数据 文件 返回 给 了 他 们 ( 
3.13), 。 换 名 话说， 安 索 拉 比 耕 和 赫 什 的 研究 只 有 将 投票 记录 与 调查 数据 
结合 起 来 才能 开展 ， 如 果 只 有 投票 记录 或 只 有 调查 数据 ， 研 究 是 不 可 能 
展 的 。 


利用 结合 后 的 数据 文件 ， 安 索 拉 比 灰 和 赫 什 得 出 了 三 个 重要 结论 。 首 先 ， 
过 度 报 告 投票 行为 的 现象 很 是 普遍 : 未 投票 者 中 几乎 有 一 半 的 人 报告 称 自 
己 投 过 票 ， 并 且 如 果 有 人 报告 称 自己 投 过 票 ， 实 际 上 他 真正 投 过 票 的 概率 


只 有 80%。 其 次 ， 过 度 报告 并 不 是 随机 的 : 过 度 报 告 在 高 收入 、 受 过 良好 
教育 、 参 与 公共 事务 的 党 派 人 士 中 更 为 常见 。 换 句 话说 ， 最 有 可 能 投票 的 
人 也 最 有 可 能 谎报 自己 投 过 票 。 最 后 ， 也 是 最 重要 的 一 个 结论 是 ， 由 于 过 
度 报告 的 系统 性 ， 投 票 者 和 未 投票 者 之 间 的 实际 差异 比 调 查 所 显示 的 要 
小 。 例 如 ， 拥 有 学 士 学 位 的 人 报告 称 自己 投 过 票 的 可 能 性 要 比 没有 的 人 高 
约 22%， 而 其 实际 投票 的 可 能 性 只 高 出 了 10%。 事 实证 明 ， 相 比 于 预测 谁 
会 真正 投票 ， 现 有 的 以 数据 源 为 基础 的 理论 在 预测 谁 会 报告 称 自己 投 过 票 
( 这 也 是 研究 人 员 过 去 所 使 用 的 数据 ) 方面 ， 准 确 度 会 更 高 。 因 此 ， 安 这 
拉 比 赫 和 赫 什 的 实证 发 现 表 明 ， 我们 需要 新 的 理论 来 理解 和 预测 投票 。 
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图 3.13 安 这 拉 比 赫 和 赫 什 的 研究 示意 图 。 为 了 创建 主 数据 文件 ，Catalist 
需 将 多 个 不 同 来 源 的 信息 进行 汇总 和 统一 。 这 一 过 程 ， 无 论 多 么 小 心 ， 都 
会 使 原始 数据 资源 中 的 错误 得 以 传播 ， 同 时 还 会 引发 新 的 错误 。 第 二 个 错 
误 的 来 源 是 调查 数据 和 主 数据 文件 之 间 的 记录 链接 。 如 果 每 个 人 在 上 述 两 
个 数据 资源 中 都 有 一 个 稳定 的 、 唯 一 的 标识 符 ， 那 么 链接 就 会 很 简单 。 但 
Catalist 只 能 通过 不 完美 的 标识 符 ( 在 该 事例 中 是 指 姓名 、 性 别 、 出 生年 份 
以 及 家 庭 住址 ) 进行 链接 。 不 幸 的 是 ， 在 许多 情况 下 会 出 现 不 完整 或 不 精 
确 的 信息 ， 例 如 一 位 名 叫 符 马 .辛普森 (Homer Simpson ) 的 投票 者 可 能 会 
MEAG RR FS). 辛普森 ， 甚 至 是 拼 错 单词 。 尽 管 主 数据 
文件 中 和 记录 链接 过 程 中 都 有 可 能 出 现 错误 ， 但 通过 几 种 不 同类 型 的 检 
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但 对 于 这 些 结果 我 们 又 能 信任 多 少 呢 ? 不 要 忘 了 这 些 结果 依 赖 于 一 个 易于 
出 错 的 链接 过 程 ， 而 且 这 一 过 程 需要 链接 至 拥有 未 知 数量 错误 的 黑匣子 似 
的 数据 中 。 更 具体 地 说 ， 这 些 结果 取决 于 两 个 关键 步 又 : (1 ) Catalist 将 
许多 完全 不 同 的 数据 资源 汇总 后 ， 形 成 一 个 精确 的 主 数据 文件 ; (2 ) 将 
调查 数据 链接 至 上 述 主 数据 文件 。 其 中 每 个 步骤 都 很 困难 ， 而 且 任何 一 个 
步骤 中 的 错误 都 会 导致 研究 人 员 得 出 错误 的 结论 。 


然而 ， 作 为 一 个 公司 ， 数 据 处 理 和 链接 对 其 继续 生存 来 说 至 天 重要 ， 所 以 
Catalist 能 以 学 术 研 究 人 员 无 法 企及 的 规模 投入 资源 ， 解 决 这 些 问 题 。 在 他 
们 的 论文 中 ， 安 索 拉 比 赫 和 赫 什 通过 一 系列 步骤 检查 了 上 述 两 个 步骤 的 结 
果 (尽管 有 些 是 不 对 外 开放 的 ) ， 这 些 检查 对 其 他 想 要 将 调查 数据 和 黑 匣 
子 似 的 大 数据 资源 结合 起 来 的 研究 人 员 可 能 会 有 所 帮助 。 


一 般 来 说 ， 研究 人 员 通 过 该 研究 能 学 到 什么 经 验 呢 ? 首先 ， 无 论 是 利用 调 
查 数据 丰富 大 数据 资源 还 是 利用 大 数据 资源 丰富 调查 数据 ( 我 们 可 以 用 任 
何 一 种 方式 看 待 该 研究 ) ， 都 有 巨大 的 价值 。 通 过 将 两 个 数据 资源 相 结 
合 ， 研 究 人 员 就 能 做 那些 如 果 只 有 调查 数据 或 只 有 大 数据 资源 就 不 可 能 做 
的 事情 。 其 次 ， 尽 管 汇总 后 的 商业 数据 ， 例 如 Catalist 的 数据 ， 不 应 被 看 作 
绝对 真实 ， 但 在 有 些 情况 下 ， 这 些 数 据 也 是 有 用 的 。 怀 疑 论 者 有 时 会 将 这 
些 汇总 后 的 商业 数据 与 绝对 真实 进行 比较 ， 并 指出 这 些 数据 资源 存在 着 不 
足 。 但 就 这 一 情况 而 言 ， 怀疑 论 者 其 实 正在 做 错误 的 比较 ， 因 为 研究 人 员 
使 用 的 所 有 数据 都 达 不 到 绝对 真实 。 因 此 ， 比 较 好 的 做 法 是 ， 将 汇总 后 的 
商业 数据 资源 与 其 他 同样 会 有 错误 的 可 用 数据 资源 (例如 ， 受 访 者 自我 报 
告 的 投票 行为 ) 进行 比较 。 最 后 ， 在 某 些 情况 下 ， 研 究 人 员 可 能 会 从 许多 
私人 公司 在 搜集 和 统一 复杂 的 社会 数据 集 方面 的 巨大 投资 中 获 益 。 


3.6.2 扩充 型 提问 


扩充 型 提问 会 通过 一 个 预测 模型 将 源 于 少数 人 的 调查 数据 与 源 于 许多 人 的 
一 个 大 数据 资源 结合 起 来 。 


将 调查 数据 和 大 数据 资源 结合 起 来 的 另 一 种 方法 ， 我 称 之 为 扩充 型 提问 。 

在 扩充 型 提问 中 ， 研 究 人 员 会 通过 一 个 预测 模型 将 少量 的 调查 数据 与 一 个 
大 数据 资源 结合 起 来 ， 然 后 利用 结合 后 的 数据 得 出 评估 结论 ， 这 些 评估 结 
论 的 规模 或 粒度 是 只 通过 调查 数据 或 大 数据 资源 不 可 能 实现 的 。 扩 充 型 提 
问 的 一 个 重要 事例 是 乔 舒 亚 ` 布 卢 门 斯 托 克 的 研究 ， 他 想 搜集 有 助 于 指导 贫 
穷 国家 发 展 的 数据 。 在 过 去 ， 搜 集 此 类 数据 的 研究 人 员 一 般 只 能 采取 以 下 
两 种 方法 中 的 一 种 : 抽样 调查 或 人 口 普 查 。 只 需要 研究 人 员 采 访 少量 人 的 
抽样 调查 比较 灵活 、 及 时 且 成 本 相对 较 低 ， 但 因 这 些 调查 是 基于 一 个 样本 


的 ， 所 以 其 分 辨 率 通 常 是 有 限 的 。 也 就 是 说 ， 通 过 一 项 抽样 调查 ， 通 常 很 
难 对 特定 的 地 理 区 域 或 人 口 群体 做 出 评估 。 而 人 口 普 查 则 试图 采访 每 一 个 
人 “， 因 此 研究 人 员 可 以 通过 人 口 普查 对 小 的 地 理 区 域 或 人 口 群体 进行 评 
估 。 但 人 口 普查 往往 成 本 高 、 关 注 面 小 ( 它 只 包含 少量 的 问题 ) ， 而 且 不 
及 时 ( 它 按 固定 的 时 间 表 进行 ， 例 如 每 隔 10 年 普查 一 次 (Kish 

1979 ) 。 与 其 勉强 接受 抽样 调查 或 是 人 口 普查 ， 研究 人 员 还 不 如 设想 一 下 
能 否 将 两 种 方法 各 自 的 最 佳 特征 结合 起 来 ， 能 和 否 每 天 向 每 一 个 人 提出 每 一 
个 问题 。 显 然 ， 这 种 无 处 不 在 的 、 不 间断 的 调查 只 是 一 种 社会 科学 幻想 。 
但 通过 将 源 于 少量 人 的 调查 问题 与 源 于 许多 人 的 数字 痕迹 相 结 合 ， 我 们 似 
平 确实 可 以 接近 这 一 幻想 。 


布 卢 门 斯 托 克 的 研究 始 于 他 与 卢旺达 最 大 的 手机 供应 商 的 合作 ， 该 供应 商 
向 其 提供 了 2005 一 2009 年 间 约 150 万 名 用 户 的 匿名 记录 。 这 些 记录 含有 每 
次 通话 和 每 条 短信 的 相关 信息 ， 例 如 起 始 时 间 、 持 续 时 间 以 及 呼叫 方 和 接 
收 方 大 致 的 地 理 位 置 。 在 我 谈论 统计 问题 之 前 ， 值 得 指出 的 是 ， 获 取 数 据 
这 第 一 步 对 许多 研究 人 员 来 说 可 能 是 最 难 的 步骤 之 一 。 正 如 我 在 第 2 章 所 
描述 的 ， 大 多 数 大 数据 资源 都 是 研究 人 员 难 以 获取 的 。 电 话 元 数据 尤其 难 
以 获取 ， 因 为 它们 基本 上 是 不 可 能 被 “匿名 化 ”的 ， 而 且 几 平一 定 会 包含 参 
与 者 认为 敏感 的 信息 (Mayer, Mutchler, and Mitchell 2016; Landau 
2016 ) 。 在 布 卢 门 斯 托 克 的 研究 中 ， 研 究 人 员 在 保护 数据 方面 很 是 谨慎 ， 
而 且 有 一 个 第 三 方 〈 即 他 们 的 机 构 审 查 委员 会 ) 负责 监督 他 们 的 工作 。 我 
将 在 第 6 章 更 详细 地 探究 这 些 道德 伦理 问题 。 


布 卢 门 斯 托 克 感 兴趣 的 是 衡量 财富 状况 和 幸福 感 ， 但 通话 记录 中 并 没有 直 
接 记 录 这 些 特性 。 换 名 话说， 对 该 研究 来 说 ， 这 些 通话 记录 具有 不 完整 

性 ， 这 是 大 数据 资源 所 共有 的 一 个 特征 ， 在 第 2 章 中 我 详细 介绍 过 这 一 

点 。 但 通话 记录 很 可 能 包含 一 些 能 间接 提供 有 天 财富 状况 和 幸福 感 的 信息 
内 容 。 鉴 于 这 种 可 能 性 ， 布 卢 门 斯 托 克 想 ， 是否 有 可 能 训练 一 个 机 器 学 习 
模型 ， 该 模型 能 通过 通话 记录 预测 某 个 人 在 一 项 调查 中 会 如 何 作答 ? 如 果 
这 是 可 行 的 ， 那 么 布 卢 门 斯 托 克 就 能 利用 这 一 模型 预测 150 万 名 用 户 的 调 


A 
BER, 


为 了 创建 和 训练 这 样 一 个 模型 ， 布 卢 门 斯 托 克 和 来 自 基 加 利 科 学 技术 研究 
所 (Kigali Institute of Science and Technology ) 的 研究 助理 随机 抽取 了 
约 1000 名 用 户 。 研 究 人 员 向 参与 者 解释 说 明了 研究 的 目的 ， 并 就 将 调查 答 
案 与 通话 记录 结合 起 来 征求 了 他 们 的 同意 ， 然 后 向 他 们 提 了 一 系列 的 问 
题 ， 以 衡量 其 财富 状况 和 幸福 感 ， 例 如 “你 有 收音 机 吗 ? ”以 及 “你 有 自行 车 
吗 ?”( 部 分 问题 列表 参见 图 3.14 ) 。 所 有 参与 调查 的 人 都 获得 了 经 济 

AN. 


接 下 来 ， 布 卢 门 斯 托 克 采用 了 机 器 学 习 中 常见 的 两 步 法 : 特征 工程 、 监 下 


式 学 习 。 首 先 ， 在 特征 工程 这 一 步 中 ， 布 卢 门 斯 托 克 将 通话 记录 转换 成 了 
天 于 每 个 受 访 者 的 一 组 特征 ， 数 据 科 学 家 可 能 会 称 这 些 特征 为 “特征 ”， 而 
社会 科学 家 则 可 能 称 之 为 “变量 ”。 例 如 ， 布 卢 门 斯 托 克 会 计算 出 每 个 人 的 
总 活跃 天 数 、 联 系 过 的 人 (不 同 的 人 ) 的 数量 以 及 通话 费 等 。 这 一 步 中 至 
天 重要 的 一 点 是 ， 好 的 特征 工程 需要 研究 人 员 了 解 研究 环境 。 例 如 ， 如 果 
区 分 国内 电话 和 国际 电话 很 重要 ( 我 们 可 能 会 认为 打 国 际 电话 的 人 更 富 
有 ) ， 那 么 这 一 工作 就 必须 在 特征 工程 这 一 步 进行 。 而 对 卢旺达 知之 甚 少 
的 研究 人 员 可 能 就 不 会 考虑 这 一 特征 ， 模 型 的 预测 性 能 就 会 受到 影响 。 


[image] 


图 3.14 用 通话 记录 训练 统计 模型 的 预测 精度 。 改编 自 
Blumenstock (2014) , #2, 


接 下 来 ， 在 监督 式 学 习 这 一 步 中 ， 布 户 门 斯 托 克 创建 了 一 个 模型 ， 根 据 每 
个 人 的 特征 预测 其 调查 答案 。 在 该 步骤 中 ， 布 卢 门 斯 托 克 采用 了 逻辑 回 
归 ， 但 其 实 他 也 可 以 采用 其 他 统计 或 机 器 学 习 方 法 。 


那么 该 模型 的 效果 如 何 呢 ? 根据 从 通话 记录 中 提取 的 特征 ， 布 卢 门 斯 托 克 
是 否 能 利用 该 模型 预测 用 户 对 诸如 “你 有 收音 机 吗 ? ”以 及 “你 有 自行 车 
i? ”的 调查 问题 的 回答 吗 ? 为 了 评估 其 预测 模型 的 性 能 ， 布 卢 门 斯 托 克 
采用 了 交叉 验证 ， 该 方法 在 数据 科学 中 很 常用 ， 但 在 社会 科学 中 很 少 被 采 
用 。 交 叉 验 证 的 目的 是 公平 评估 一 个 模型 的 预测 性 能 ， 做 法 是 利用 不 同 的 
子 数据 集训 练 并 测试 该 模型 。 具 体 来 说 ， 布 卢 门 斯 托 克 先 将 其 数据 分 成 了 
10 组 ， 每 组 包含 100 人 的 数据 。 然 后 ， 他 用 其 中 9 组 数据 来 训练 模型 ， 然 
后 用 剩余 的 1 组 数据 来 评估 该 模型 的 预测 性 能 。 他 将 这 一 过 程 重复 了 10 
次 ， 每 次 选 1 组 不 同 的 数据 来 验证 模型 的 预测 性 能 ， 而 其 余 9 组 数据 则 用 于 
训练 模型 ， 最 后 取 平 均值 。 


该 模型 对 某 些 特征 的 预测 精度 是 很 高 的 ( 图 3.14 ) ， 例 如 预测 某 人 是 否 有 
收音 机 的 精确 度 能 达到 97.6%。 这 听 起 来 可 能 很 不 错 ， 但 将 一 个 复杂 的 预 
测 模型 与 一 个 简单 的 替代 方法 进行 比较 通常 是 很 重要 的 。 在 该 事例 中 ， 一 
个 简单 的 替代 方法 就 是 预测 每 个 人 都 会 给 出 最 常见 的 回答 。 例 如 ，97.3% 
的 受 访 者 回答 说 自己 有 收音 机 ， 因 此 ， 如 果 布 卢 门 斯 托 克 预测 每 个 人 都 会 
回答 说 自己 有 收音 机 ， 那 么 他 的 精确 度 就 是 97.3%， 这 与 他 更 复杂 的 预测 
模型 的 表现 ( 97.6% 的 精确 度 ) 竟 惊 人 地 相似 。 换 句 话 说， 所 有 复杂 的 数 
据 和 建 模 工 作 只 是 把 预测 精确 度 从 97.3% 提 高 到 了 97.6%。 但 对 其 他 问 

题 ， 例 如 “你 有 自行 车 吗 ? ”, 预测 精确 度 就 从 54.4% 提 高 到 了 67.6%。 更 
概括 地 说 ， 图 3.15 表 明 ， 对 某 些 特征 来 说 ， 相 比 于 简单 的 基线 预测 ( 即 预 
测 每 个 人 都 会 给 出 最 常见 的 回答 ) ， 布 卢 门 斯 托 克 的 模型 并 没有 明显 提高 
精确 度 ， 但 对 其 他 一 些 特征 来 说 还 是 有 些 改 善 的 。 但 仅 从 这 些 结果 来 看 ， 


你 可 能 会 觉得 这 种 方法 并 不 是 特别 有 前 景 
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13.15 利用 通话 记录 训练 的 统计 模型 的 预测 精度 与 简单 的 基线 预测 的 预 
测 精 度 的 对 比 。 为 了 避免 重 亚 ， 有 的 数值 有 轻微 调整 。 改编 自 
Blumenstock (2014) , #2, 


然而 ， 仅 仅 一 年 后 ， 布 卢 门 斯 托 克 和 两 位 同事 ， pese. 

( Gabriel Cadamuro ) 和 罗伯特 : 翁 (Robert On) ， 就 大 大 改进 了 研究 

果 ( Blumenstock, Cadamuro, and On 2015) , 并 在 《科学 》 oe 
了 他 们 的 论文 。 这 一 改进 主要 有 两 个 技术 原因 : (1) 他 们 采用 了 更 复杂 
的 方法 ( 即 在 特征 工程 这 一 步 中 采用 了 新 的 方法 ， 并 创建 了 更 复杂 的 模型 
来 利用 特征 预测 回答 ; (2)1 他 们 不 再 试图 推断 单个 调查 问题 ( 例 

如 ,“ 你 有 收音 机 吗 ? >) 的 答案 ， 而 是 试图 推断 综合 财富 指数 。 这 些 技术 
上 的 改进 意 味 着 他 们 可 以 合理 地 利用 通话 记录 预测 样本 中 用 户 的 财富 状 
况 。 


但 预测 样本 中 用 户 的 财富 状况 并 不 是 他 们 研究 的 最 终 目标 ， 他 们 的 最 终 目 
标 是 将 抽样 调查 和 人 口 普查 各 自 的 最 佳 特征 结合 起 来 ， 从 而 对 发 展 中 国家 
的 贫穷 状况 进行 准确 的 、 高 分 辩 率 的 评估 。 为 了 判断 他 们 是 否 有 能 力 实现 
这 一 目标 ， 布 卢 门 斯 托 克 和 同事 用 他 们 的 模型 和 数据 预测 了 150 万 名 用 户 


的 财富 状况 。 他 们 还 利用 通话 记录 中 的 位 置信 息 (通话 记录 中 有 每 次 通话 
时 用 户 离 得 最 近 的 手机 信号 塔 的 位 置 ) 评估 了 每 个 人 大 致 的 居住 地 ( 
3.16 ) 。 通 过 将 这 两 项 评估 结合 在 一 起 ， 布 卢 门 斯 托 克 和 同事 得 出 的 评估 
结论 ， 是 关于 用 户 财 富 地 理 分 布 的 极 细 粒 度 〈 指 空间 粒度 ) 的 。 例 如 ， 他 
们 能 够 估算 出 卢旺达 2148 个 街区 中 每 一 个 街区 的 平均 财富 状况 。 


那么 这 些 评估 结论 与 该 地 区 的 真实 贫困 水 平 的 符合 程度 如 何 呢 ? 在 回答 这 
个 问题 之 前 ， 我 想 强调 一 个 事实 ， 那 就 是 大 家 有 很 多 理由 持 怀疑 态度 。 例 
如 ， 在 个 体 层 面 上 进行 的 预测 ， 其 结果 相当 参差 不 齐 〈 图 3.17 ) 。 此 外 ， 
也 许 更 重要 的 一 点 是 ， 有 手机 的 人 与 没有 手机 的 人 可 能 会 有 系统 性 的 差 
别 。 因 此 ， 布 卢 门 斯 托 克 和 同事 可 能 也 会 受到 履 盖 面 误差 的 困扰 ， 类 似 于 
我 之 前 所 描述 的 1936 年 《文学 文摘 》 的 调查 。 


为 了 了 解 他 们 评估 结论 的 质量 ， 布 卢 门 斯 托 克 和 同事 需要 将 其 数据 与 其 他 
东西 进行 比较 。 幸 运 的 是 ， 就 在 他 们 进行 该 项 研究 的 同时 ， 另 一 组 研究 人 
员 也 正在 卢旺达 进行 一 项 传统 的 社会 调查 。 这 项 调查 是 广 受 重视 的 人 口 统 
计 和 健康 调查 的 一 部 分 ， 拥 有 大 量 预算 ， 采 用 的 是 高 质量 的 传统 方法 。 
此 ， 人 口 统计 和 健康 调查 的 评估 结论 可 以 被 合理 地 认为 是 黄金 标准 。 人 们 
将 这 两 种 评估 进行 比较 后 发 现 ， 它 们 非常 相似 ( 图 3.17 ) 。 换 句 话说 ， 通 
过 将 少量 调查 数据 与 通话 记录 结合 起 来 ， 布 卢 门 斯 托 克 和 同事 得 出 了 与 采 
用 黄金 标准 的 方法 所 得 出 的 评估 结论 相 类 似 的 结论 。 
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213.16 布 卢 门 斯 托 克 、 卡 达 穆 罗 以 及 翁 的 研究 示意 图 。 首 先 ， 他 们 将 手 
机 供应 商 的 通话 记录 转换 成 了 矩阵， 其 中 每 个 人 占 一 行 ， 每 个 特征 〈( 即 变 
量 ) 占 一 列 。 接 下 来 ， 他 们 创建 了 一 个 监督 式 学习 模 型 ， 以 通过 上 述 答 阵 
预测 调查 答案 。 然 后 ， 他 们 利用 该 模型 预测 150 万 名 用 户 的 调查 答案 。 此 
外 ， 他 们 还 根据 这 些 用 户 打 电话 时 的 位 置 评估 了 150 万 名 用 户 大 致 的 居住 
地 。 在 把 这 两 项 评估 ， 即 财富 状况 和 居住 地 ， 结 合 起 来 后 ， 其 结果 与 人 口 
统计 和 健康 调查 的 评估 结果 很 相似 ， 而 人 口 统 计 和 健康 调查 被 认为 是 黄金 
标准 的 传统 调查 。 
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图 3.17 布 卢 门 斯 托 克 、 卡 达 穆 罗 以 及 翁 的 研究 结果 。 在 个 体 层 面 上 ， 研 
究 人 员 能 通过 某 人 的 通话 记录 来 合理 预测 其 财富 状况 。 基 于 个 体 层面 的 财 
富 状 况 和 居住 地 的 评估 所 得 出 的 卢旺达 30 个 地 区 的 地 区 级 财富 状况 评估 , 
与 人 口 统计 和 健康 调查 的 评估 结果 很 相似 ， 而 人 口 统计 和 健康 调查 被 认为 
是 黄金 标准 的 传统 调查 。 改 编 自 Blumenstock, Cadamuro, and 

On (2015 ) ， 图 la 和 图 3c。 


寺 怀疑 态度 的 人 可 能 会 认为 这 些 结果 是 令 人 失望 的 。 毕 竟 ， 对 布 户 门 斯 托 
克 和 同事 的 研究 的 一 种 解读 方式 是 ， 利 用 现 有 的 方法 能 更 可 靠 地 得 出 他 们 
通过 大 数据 和 机 器 学 习 所 得 出 的 评估 结论 。 但 我 认为 这 并 不 是 解读 该 研究 
的 正确 方式 ， 原 因 有 以 下 两 点 。 首 先 ， 相 比 于 现 有 的 方法 ， 布 卢 门 斯 托 克 
和 同事 得 出 评估 结论 所 采用 的 方法 要 快 10 倍 ， 成 本 降 为 1/50 (以 可 变 成 本 
计算 ) 。 正 如 我 在 上 文 所 论述 的 一 样 ， 研 究 人 员 忽 视 成 本 问题 可 能 会 给 

己 带 来 麻烦 。 就 拿 布 卢 门 斯 托 克 和 同事 的 研究 为 例 ， 相 比 于 每 隔 几 年 开展 
一 次 (这 是 该 调查 的 一 个 标准 ) 的 人 口 统计 和 健康 调查 ， 布 卢 门 斯 托 克 和 
同事 在 成 本 上 的 巨大 优势 意味 着 他 们 每 个 月 都 可 以 开展 这 样 的 研究 ， 这 将 


为 研究 人 员 和 决策 者 带 来 诸多 好 处 。 其 次 ， 该 研究 采取 的 方法 经 调整 后 可 
以 被 用 于 许多 不 同 的 研究 。 该 方法 仅 需 要 两 类 资源 及 两 个 步骤 。 这 两 类 资 
源 分 别 是 : (1) 广 而 薄 的 大 数据 资源 ( 即 该 资源 包含 许多 人 ， 但 没有 你 
需要 的 关于 每 个 人 的 信息 ) ; (2) 窄 而 厚 的 调查 数据 ( 即 该 数据 只 包含 
少量 人 ， 但 其 中 有 你 需要 的 关于 这 些 人 的 信息 ) 。 然 后 需要 用 两 步 把 这 些 
资源 结合 起 来 。 首先 ， 为 两 个 数据 资源 中 的 人 创建 一 个 机 器 学 习 模 型 ， 该 
模型 可 以 利用 数字 痕迹 预测 调查 答案 。 然 后 ， 用 该 模型 推断 上 述 大 数据 资 
源 中 每 个 人 的 调查 答案 。 因 此 ， 如 果 你 有 一 些 问 题 想 问 很 多 人 ， 那 就 可 以 
找 一 个 有 关 这 些 人 的 大 数据 资源 ， 哪 怕 是 你 不 感 兴趣 的 大 数据 资源 也 行 ， 
因为 它 也 许 能 预测 这 些 人 将 如 何 回答 你 的 问题 。 也 就 是 说 ， 布 卢 门 斯 托 克 
和 同事 最 初 并 不 是 关心 通话 记录 ， 他 们 之 所 以 留意 这 些 通话 记录 ， 是 因为 
其 可 以 预测 他 们 真正 关心 的 调查 答案 。 扩 充 型 提问 有 别 于 我 之 前 描述 过 的 
岁入 式 提 问 ， 你 只 需要 对 大 数据 资源 有 非 直接 的 兴趣 即 可 。 


综 上 所 述 ， 布 卢 门 斯 托 克 通过 采用 扩充 型 提问 得 出 的 结论 与 符合 黄金 标准 
的 调查 评估 结论 类 似 。 该 研究 事例 也 阐明 了 扩充 型 提问 和 传统 的 调查 方法 
各 自 存 在 的 利弊 。 利 用 扩充 型 提问 进行 评估 更 及 时 ， 具 有 明显 的 成 本 优 
势 ， 且 得 出 的 结论 粒度 更 细 。 但 这 类 扩充 型 提问 目前 还 没有 很 强 的 理论 基 
础 。 仅 赁 这 一 个 事例 并 不 能 说 明 该 方法 何 时 有 效 、 何 时 无 效 ， 而 且 使 用 该 
方法 的 研究 人 员 需 格外 注意 因 所 使 用 的 大 数据 资源 包含 某 些 人 而 未 包含 另 
外 一 些 人 而 可 能 导致 的 偏差 。 此 外 ， 扩 充 型 提问 目前 还 没有 好 的 方法 来 量 
化 其 评估 结论 的 不 确定 性 。 幸 运 的 是 ， 扩 充 型 提问 与 统计 学 中 的 三 大 领域 
有 着 很 深 的 关联 。 这 三 大 领域 分 别 是 小 区 域 估计 ( Rao and Molina 
2015), 、 填 补 法 (Rubin 2004) 以 及 基于 模型 的 事后 分 层 ( 该 领域 与 我 
在 前 面 介绍 的 “P 先 生 ” 这 一 方法 紧密 相关 ) 。 鉴 于 这 些 很 深 的 关联 性 ， 我 
预计 扩充 型 提问 的 许多 方法 论 基 础 都 将 很 快 得 到 增强 。 


最 后 ， 通 过 对 比 布 卢 门 斯 托 克 的 第 一 次 和 第 二 次 尝试， 我 们 还 能 学 到 有 天 
数字 时 代 社 会 研究 的 一 个 重要 经 验 : 开始 并 不 是 结束 。 也 就 是 说 ， 许 多 时 
候 ， 第 一 次 的 方法 可 能 并 不 是 最 好 的 ， 但 如 果 研 究 人 员 继 续 努 力 ， 情 况 就 
会 变 得 更 好 。 更 广 沁 地 说 ， 在 评估 数字 时 代 社 会 研究 的 新 方法 时 ， 进 行 以 
下 两 项 截然 不 同 的 评估 是 很 重要 的 : (1) 该 方法 在 当下 的 效果 如 何 ? 
(2) 随 着 数据 概况 的 改变 以 及 研究 人 员 投 入 更 多 的 关注 在 这 个 问题 上 , 
该 方法 的 效果 又 将 如 何 ? 尽管 研究 人 员 接 受过 第 一 类 评估 的 培训 (评估 一 
项 特定 研究 的 好 坏 ) ， 但 第 二 类 评估 往往 更 为 重要 。 


3.7 结论 


从 模拟 时 代 到 数字 时 代 的 转变 正在 为 调查 研究 人 员 创 造 新 的 机 会 。 在 本 章 
中 ， 我 提出 大 数据 资源 不 会 取代 调查 ， 而 且 其 丰富 性 还 将 提升 而 不 是 降低 
调查 的 价值 ( 3.2 节 ) 。 然 后 ， 我 总 结 了 在 调查 研究 的 前 两 个 时 代 发 展 起 
来 的 调查 误差 总 框架 ， 该 框 染 有 助 于 研究 人 员 开 发 和 评估 调查 研究 第 三 个 
时 代 的 方法 ( 3.3 节 ) 。 我 预计 会 出 现 令 人 兴奋 的 机 会 的 三 个 领域 分 别 

是 : (1) 非 概率 抽样 ( 3.4 节 ) , (2) 计算 机 管理 的 调查 (3.57) , 
(3) 将 调查 和 大 数据 资源 结合 起 来 ( 3.6 节 ) 。 技 术 和 社会 方面 的 变化 驱 
动 着 调查 研究 不 断 地 向 前 发 展 。 我 们 应 该 拥抱 这 一 发 展 趋势 ， 并 继续 从 之 
前 的 时 代 汲 取 智 慧 。 
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4.4 超越 简单 实验 


让 我 们 从 以 下 三 个 概念 入 手 来 实现 从 简单 实验 到 丰富 实验 的 突破 : 效 度 、 
处 理 效 应 的 异 质 性 和 原理 。 


刚 开 始 做 实验 的 研究 者 往往 会 把 注意 力 集中 在 一 个 具体 的 、 范 围 狭 小 的 问 
题 上 : 这 个 处 理 能 “起 作用 ” 吗 ? 例如 ， 一 个 志愿 者 打 来 的 电话 能 促使 一 个 
人 投票 吗 ? 将 网 站 按钮 从 蓝 色 换 成 绿色 能 增加 广告 的 点 击 率 吗 ? 不 过 遗憾 
的 是 ， 对 于 “起 作用 ”的 不 严谨 的 措辞 掩盖 了 这 样 一 个 事实 ， 即 研究 范围 狭 
隘 的 实验 是 无 法 真正 反映 一 个 处 理 是 否 能 够 在 一 般 意 义 上 “起 作用 ”的 。 相 
反 ， 该 类 型 实验 其 实 是 为 了 回答 一 个 更 具体 的 问题 : 在 特定 的 时 间 对 特定 
数量 的 参与 者 进行 此 次 特定 的 实验 ， 会 产生 怎样 的 平均 效应 呢 ? 我 个 人 会 
把 以 这 种 范围 狭小 的 问题 作为 出 发 点 的 实验 称 为 简单 实验 。 


简单 实验 能 够 提供 有 价值 的 信息 ， 但 无 法 回答 许多 重要 且 有 趣 的 问题 ， 例 
如 是 否 有 人 会 对 某 一 处 理 表 现 出 比 别人 更 为 明显 或 更 不 易 被 察觉 的 反应 ; 
是 否 有 另 一 个 更 为 有 效 的 处 理 方案 ; 以 及 这 一 实验 是 否 涉及 更 广泛 的 社会 
理论 。 


接 下 来 ， 我 将 通过 韦 斯 利 ' 舒 尔 茨 ( Wesley Schultz ) 及 其 同事 在 2007 年 针 
对 社会 规范 与 用 电量 之 间 的 关系 所 开展 的 模拟 实地 实验 来 说 明 超 越 简单 实 
验 的 价值 所 在 。 实 验 中 ， 舒 尔 黄 和 同事 选取 了 位 于 圣 马 科 斯 和 加 利 福 尼 亚 
州 的 约 300 个 家 庭 作为 实验 对 象 ， 并 在 他 们 家 门 前 挂 上 了 写 有 鼓励 人 们 节 
约 用 电 的 信息 的 门 挂牌 。 然 后 ， 舒 尔 英和 同事 分 别 在 一 周 后 和 三 周 后 测量 
了 这 些 信息 对 用 电量 的 影响 。 更 详细 的 实验 设计 描述 参见 图 4.3。 


实验 是 在 两 种 不 同 的 实验 条 件 下 开展 的 。 在 第 一 种 实验 条 件 下 ， 实 验 对 象 
收 到 的 是 一 般 的 节能 建议 (例如 使 用 风扇 而 不 是 空调 ) 和 他 们 各 自 的 用 电 
情况 与 所 在 小 区 的 平均 用 电 情 况 的 对 比 信息 。 舒 尔 区 和 同事 称 该 实验 条 件 
为 描述 性 规范 实验 条 件 ， 因 为 该 小 区 的 用 电 情 况 体现 了 一 种 典型 行为 ( 即 
描述 性 规范 ) 。 舒 尔 区 和 同事 在 研究 实施 处 理 后 该 被 测 群 体 的 用 电 情 况 时 
发 现 ， 无 论 从 短期 还 是 长 期 来 看 ， 这 一 处 理 似乎 都 没有 任何 效果 。 换 言 
之 ， 这 一 处 理 似乎 并 不 能 够 “起 作用 ”( 图 4.4 ) 。 
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图 4.3 每 尔 茨 等 人 的 实验 设计 原理 图 。 在 该 实地 实验 中 ， 研 究 人 员 需 在 8 
周 时间 内 和 拜访 圣 马 科斯 和 加 利 福 尼 亚 州 约 300 个 家 庭 。 每 次 拜访 时 ， 研 究 
人 员 都 需 手动 记录 下 相应 家 庭 电 表 的 读数 。 在 其 中 的 两 次 拜访 中 ， 他 们 还 
需 将 写 有 家 庭 用 电 情 况 的 门 挂牌 挂 在 相应 家 庭 的 门 上 。 该 项 实验 的 研究 课 
题 是 ， 这 些 信息 的 内 容 如 何 影响 居民 用 电量 。 


幸运 的 是 ， 舒 尔 基 和 同事 并 没有 满足 于 这 一 简单 的 分 析 。 其 实在 实验 开始 
前 ， 他 们 曾 推 断 ， 用 电量 大 的 居民 ， 即 高 于 平均 用 量 的 居民 ， 其 用 电量 可 
能 会 减少 ; 而 用 电量 小 的 居民 ， 即 低 于 平均 用 量 的 居民 ， 其 用 电量 则 可 能 
会 增加 。 然 后 当 他 们 仔细 研究 具体 数据 时 发 现 ， 的 确 是 这 样 的 (图 

4.4 ) 。 因 此 ， 看 起 来 没有 任何 效果 的 处 理 ， 实 际 上 是 产生 了 两 个 相互 抵 
消 的 效果 。 其 中 在 低 用 电量 群体 中 所 产生 的 适得其反 的 上 涨 效 果 则 是 “ 飞 
去 来 器 效应 ”的 一 个 例子 ， 即 某 一 处 理 产 生 了 与 原 目 标 相反 的 效应 。 


第 二 种 实验 条 件 下 的 实验 与 第 一 种 是 同时 进行 的 。 在 该 实验 条 件 下 ， 被 测 
家 庭 收 到 了 几乎 完全 相同 的 门 挂牌 , 上面 写 有 一 般 节 能 建议 和 他 们 各 自 的 
用 电 情 况 与 所 在 小 区 的 平均 用 电 情 况 的 对 比 信息 ， 不 过 还 增加 了 一 个 小 细 
节 : 对 于 低 用 电量 居民 ， 研究 人 员 会 额外 附 上 表情 符号 @ ; 而 对 于 高 用 电 
量 居民 ， 研 究 人 员 则 会 额外 附 上 @。 这 些 表情 符号 由 在 运用 研究 人 员 所 称 
的 指令 性 规范 。 指 令 性 规范 旨 在 表明 什么 是 被 人 们 赞同 〈 或 者 不 赞同 ) 的 
行为 ， 而 描述 性 规范 旨 在 表明 人 们 应 该 做 什么 (Reno, Cialdini and 
Kallgren 1993 ) 。 


通过 加 上 这 个 小 小 的 表情 符号 ， 研 究 人 员 大 大 减轻 了 在 低 用 电量 居民 中 所 
出 现 的 “ 飞 去 来 器 效应 ”( 图 4.4 ) 。 因 此 ， 这 一 简单 的 改变 ( 受到 一 个 抽象 
的 社会 心理 学 理论 的 启发 ) 使 原本 似乎 不 可 行 的 项 目 变 得 可 行 了 ， 与 此 同 
时 ， 这 一 实验 还 能 使 人 们 更 进一步 地 理解 社会 规范 是 如 何 影响 人 类 行为 
的 。 
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图 4.4 舒 尔 茨 等 人 的 研究 结果 。 图 中 第 一 栏 表明 ， 描 述 性 规范 所 产生 的 平 
均 处 理 效 应 ( 即 对 被 测 群体 整体 用 电量 的 影响 ) 几乎 为 零 。 但 是 ， 第 二 栏 
表明 ， 该 平均 处 理 效应 实际 上 包含 了 两 种 相互 抵消 的 效应 。 对 于 高 用 电量 
居民 ， 描 述 性 规范 会 降低 他 们 的 用 电量 ， 但 是 对 于 低 用 电量 居民 ， 描 述 性 
规范 反而 会 增加 他 们 的 用 电量 。 最 后 ， 第 三 栏 表明 ， 第 二 种 处 理 ， 即 同时 
运用 描述 性 和 指令 性 规范 ， 对 高 用 电量 居民 产生 的 影响 与 第 一 种 处 理 几乎 
相同 ， 但 是 减轻 了 在 低 用 电量 居民 中 所 出 现 的 “ 飞 去 来 器 效应 ” 该 图 根据 
舒 尔 区 等 人 的 研究 结果 绘制 。 


然而 ， 你 也 可 能 会 发 现 ， 舒 尔 菊 及 其 同事 的 实验 与 其 他 实验 有 一 点 不 同 。 


那 就 是 ， 这 个 实验 并 没有 像 随 机 对 照 实验 那样 有 一 个 对 照 组 。 其 实 通过 对 
比 该 实验 设计 跟 雷 斯 蒂 沃 和 范 德 里 杰 特 的 实验 设计 ， 就 能 曾 明 以 下 两 种 主 
要 实验 设计 的 差异 。 在 “被 试 间 ” 设 计 中 ， 比 如 雷 斯 蒂 沃 和 范 德 里 杰 特 的 实 
验 设 计 ， 会 设置 一 个 实验 组 和 一 个 对 照 组 。 但 在 “被 试 内 ”设计 中 ， 则 是 把 


参与 者 在 接受 实验 处 理 前 和 后 的 行为 做 对 比 ( Greenwald 1976 ; 
Charness, Gneezy, and Kuhn 2012 ) 。 在 采用 被 试 内 设计 的 实验 中 ， 每 个 
参与 者 似乎 同时 也 是 自己 的 对 照 组 。 被 试 间 设 计 的 优势 在 于 降低 了 混淆 变 
量 的 干扰 (正如 我 在 前 文中 提 太 的 ) ， 而 被 试 内 设计 的 优势 则 在 于 提高 了 
估计 结果 的 准确 性 。 然 后 ， 在 后 面 的 章节 中 我 会 针对 如 何 设计 数字 实验 给 
出 建议 ， 其 中 就 会 涉及 混合 设计 ， 该 设计 融合 了 被 试 内 设计 的 高 准确 度 以 
及 被 试 则 设计 的 低 干扰 性 ( 见 图 4.5 ) 。 


总 的 来 说 ， 舒 尔 茨 及 其 同事 的 实验 的 设计 和 结果 都 说 明了 超越 简单 实验 的 
价值 。 幸 运 的 是 ， 并 非 只 有 创造 性 的 天 才 才 能 设计 出 这 样 的 实验 。 社 会 科 
学 家 已 经 提出 了 三 个 理念 来 指导 我 们 设计 出 更 丰富 的 实验 : (1) ME; 
C2) 处 理 效应 的 异 质 性 ; 〈3 ) 原理 。 也 就 是 说 ， 如 果 你 在 设计 实验 的 时 
候 牢记 这 三 个 理念 ， 那 么 你 自然 而 然 地 会 设计 出 一 个 更 有 趣 有 用 的 实验 。 
舒 尔 菊 及 其 同事 精妙 的 实验 设计 和 令 人 兴奋 的 成 果 局 发 了 一 系列 在 部 分 程 


度 上 可 以 算 作 数 字 化 的 实地 实验 ， 我 将 通过 对 这 些 后 续 实验 进行 描述 来 进 
一 步 疼 明 应 该 如 何 应 用 这 二 个 理念 。 然 后 你 会 发 现 ， 通 过 更 为 细致 的 设 
计 、 实 施 、 分 析 和 解读 ， 你 也 能 够 实现 从 简单 实验 到 丰富 实验 的 突破 。 


| 


实验 组 对 比 实 验 组 和 
被 试 间 设 计 
参与 者 
对 照 组 
对 比 处 理 前 和 
处 理 后 
被 试 内 设计 
参与 者 处 理 前 处 理 后 
处 理 前 实验 组 
a 对 比 实验 组 变化 
混合 设计 和 对 照 组 变化 
a | 
处 理 前 对 照 组 
图 4.5 上 图 为 三 种 实验 设计 。 首 先 ， 标 准 的 随机 对 照 实 验 采用 的 是 被 试 间 
设计 。 采用 被 试 间 设 计 的 实验 的 ~ 个 典型 例子 就 是 雷 斯 蒂 沃 和 范 德 里 杰 特 
进行 的 实验 ， 该 实验 旨 在 研究 谷 仓 之 星 与 用 户 对 维基 百科 的 贡献 之 间 的 关 
系 : 研究 RIBS 与 者 随机 分 为 实验 组 和 对 照 组 ， 并 给 实验 组 的 参与 者 每 


人 一 枚 谷 仓 之 星 ， 然 后 比较 两 组 的 结果 。 第 二 种 实验 设计 是 被 试 内 设计 。 

舒 尔 茨 及 其 同事 进行 的 两 个 关于 社会 规范 和 用 电量 间 关 系 的 实验 就 用 至 VT 

被 试 内 设计 : 研究 人 员 对 比 了 参与 者 在 接受 处 理 前 和 接受 处 理 后 的 用 电 

量 。 被 试 内 设计 有 利于 提高 统计 数据 的 准确 性 ， 但 是 可 能 受到 混淆 变量 的 
干扰 ( 比如 处 理 前 和 处 理 期 间 的 天 气 变化 ) (Greenwald 1976 ; 

Charness, Gneezy, and Kuhn 2012) 。 被 试 内 设计 有 时 也 被 称 为 重复 测量 

设计 。 最 后 是 混合 设计 ， 它 兼备 了 被 试 内 设计 的 高 准确 度 和 被 试 间 设 计 的 
低 干扰 性 。 在 混合 设计 中 ， 研 究 CARS 比较 实验 组 和 对 照 组 的 结果 变化 。 

如 果 研 究 人 员 已 经 掌握 了 处 理 前 信息 (在 许多 数字 实验 中 都 是 这 样 的 ) ， 


混合 设计 通常 比 被 试 间 设 计 更 可 取 ， 因 为 前 者 能 够 提高 估计 结果 的 精确 
度 。 


4.4.1 效 度 
效 度 是 指 实验 结果 符合 某 个 一 般 性 结论 的 程度 。 


没有 一 个 实验 是 完美 的 ， 研 究 人 员 创 造 了 大 量 的 词汇 来 描述 可 能 出 现 的 问 
题 。 效 度 是 指 某 一 实验 的 结果 符合 某 个 一 般 性 结论 的 程度 。 社 会 科学 家 发 
现 可 以 将 效 度 分 成 4 种 主要 类 型 : 统计 结论 效 度 、 内 部 效 度 、 构 念 效 度 和 
外 部 效 度 (Shadish, Cook, and Campbell 2001, chapter2 ) 。 掌 握 这 些 理 
念 之 后 ， 你 在 评价 和 改进 实验 的 设计 和 对 实验 进行 分 析 时 ， 心 里 就 有 谱 儿 
了 ， 而 且 它 也 会 方便 你 和 其 他 研究 人 员 交 流 。 

统计 结论 效 度 的 核心 在 于 对 实验 进行 的 统计 分 析 是 否 正 确 。 在 舒 尔 茨 及 其 
同事 的 实验 中 ， 该 效 度 的 核心 可 能 就 是 他 们 是 否 正确 地 计算 了 P 值 ` 一 。 设 
计 和 分 析 实 验 所 需 的 统计 原则 不 在 本 书 的 内 容 范 栈 内 ， 但 数字 时 代 的 到 来 
并 没有 让 这 些 原则 发 生根 本 的 改变 。 发 生 改 变 的 是 数字 实验 的 数据 环境 ， 
它 创 造 了 新 的 可 能 性 ， 例 如 利用 机 器 学 习 模型 评估 处 理 效应 的 异 质 性 
(Imai and Ratkovic 2013 ) 。 
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中 ， 该 效 度 的 核心 可 能 就 是 随机 分 组 、 实 施 处 理 和 测量 结果 。 例 如 ， 你 可 
能 会 担心 研究 助理 的 电表 读数 不 准确 。 事 实 上 ， 舒 尔 基 和 同事 也 很 担心 这 
个 问题 ， 于 是 他 们 让 助理 把 部 分 电表 读 了 两 次 ， 幸 运 的 是 ， 两 次 的 读数 基 
本 一 致 。 总 的 来 说 ， 舒 尔 英 和 同事 的 实验 的 内 部 效 度 似乎 很 高 ， 但 并 不 是 
所 有 实验 都 是 这 样 : 复杂 的 实地 实验 和 在 线 实验 在 对 正确 的 人 实施 正确 的 
处 理 和 测量 每 个 人 的 结果 方面 ， 实 际 上 经 常会 出 现 问题 。 幸 运 的 是 ， 数 字 
时 代 有 助 于 减少 对 内 部 效 度 的 担忧 ， 因 为 在 数字 时 代 ， 确 保 对 参与 者 实施 
处 理 以 及 测量 所 有 参与 者 的 结果 变 得 更 加 容易 了。 


构 念 效 度 的 核心 是 数据 和 理论 构 念 的 匹配 。 正 如 第 2 章 所 讨论 的 ， 构 念 是 
社会 科学 家 所 论证 的 抽象 概念 。 不 幸 的 是 ， 这 些 抽象 概念 并 不 总 是 有 阴 确 
的 定义 和 度量 。 在 舒 尔 滨 等 人 的 实验 中 ， 要 想 证 明 “ 指 令 性 规范 能 够 降低 
用 电量 ”这 一 观点 ， 需 要 研究 人 员 设 计 一 个 能 很 好 地 代表 指令 性 规范 的 处 
理 方式 (例如 添加 一 个 表情 符号 ) ， 并 测量 用 电量 。 在 模拟 实验 中 ， 许 多 
研究 人 员 都 是 自行 设计 自己 的 处 理 方 式 并 测量 自己 的 结果 。 这 一 方法 尽 可 
能 地 确保 了 实验 与 所 研究 的 抽象 构 念 相 匹 配 。 在 数字 实验 中 ， 研 究 人 员 则 
通过 与 企业 或 政府 合作 来 实施 处 理 ， 并 利用 不 间断 运行 的 数据 系统 来 测量 
结果 ， 所 以 实验 和 理论 构 念 之 间 的 匹配 可 能 没有 那么 紧密 。 因 此 ， 我 认为 


相 比 于 模拟 实验 ， 数字 实验 的 构 念 效 度 会 更 令 人 担忧 。 


最 后 ， 外 部 效 度 的 核心 是 该 实验 的 结果 能 否 被 推广 到 其 他 情境 中 。 就 舒 尔 
荧 等 人 的 实验 而 言 ， 人 们 可 能 会 问 ， 如 果 在 不 同 的 情境 中 以 不 同 的 方式 进 
行 实验 ， 那 么 给 人 们 提供 关于 他 们 用 电 情 况 与 所 在 小 区 的 平均 用 电 情况 的 
对 比 信息 和 一 个 代表 指令 性 规范 的 信号 ( 例如 一 个 表情 符号 ) 还 能 减少 用 
电量 吗 ? 对 于 大 多 数 精心 设计 、 步 骤 正 确 的 实验 来 说 ， 对 外 部 效 度 的 担忧 
是 最 难 解决 的 。 在 过 去 ， 有 关外 部 效 度 的 争论 通常 都 只 是 一 群 人 坐 在 一 个 
房间 里 面 ， 然 后 努力 去 想 如 果 以 不 同 的 方式 完成 实验 步 又， 或 是 在 一 个 不 
同 的 地 方 开展 实验 ， 或 是 有 不 同 的 参与 者 ， 那 么 会 发 生 什 么 。 幸 运 的 是 ， 
数字 时 代 使 研究 人 员 不 用 再 进行 这 些 缺 乏 数据 支撑 的 猪 测 了 ， 他 们 可 以 通 
过 实证 来 评估 外 部 效 度 。 


因为 舒 尔 茨 等 人 的 研究 结果 非常 令 人 兴奋 ， 所 以 欧 电 公司 (Opower ) 与 
美国 的 公用 事业 单位 联手 对 更 多 的 住户 实施 了 这 一 处 理 。 根 据 舒 尔 茨 等 
的 设计 ， 欧 电 公司 创建 了 包含 两 个 主要 模块 的 个 性 化 家 庭 能 源 报 告 ， 其 中 
一 个 模块 显示 某 一 住户 相 比 于 其 邻居 的 用 电量 情况 ， 同 时 会 附 上 一 个 相应 
的 表情 符号 ， 另 一 个 模块 则 提供 有 关 减 少 用 电量 的 建议 (图 4.6 ) 。 然 

后 ， 欧 电 公司 与 研究 人 员 一 起 开展 了 随机 对 照 实 验 ， 以 评估 这 些 家 庭 能 源 
报告 的 影响 。 尽 管 这 些 实验 的 处 理 基 本 都 是 以 非 数 字 化 的 方式 ( 通常 是 通 
过 传统 的 信件 邮寄 ) 实施 的 ， 但 对 结果 的 测量 都 是 在 物理 世界 使 用 数字 设 
备 进行 的 ( 例如 使 用 电表 ) 。 此 外 ， 欧 电 公 司 在 实验 过 程 中 还 与 电力 公司 
进行 了 合作 ， 使 得 研究 人 员 能 够 直接 访问 电力 公司 的 电力 数据 ， 而 无 须 让 
研究 助理 挨家 挨户 去 搜集 这 些 信息 。 因 此 ， 欧 电 公 司 和 合作 伙伴 以 低 可 变 
成 本 的 方式 在 大 规模 范围 内 成 功 地 开展 了 这 些 半数 字 实 地 实验 。 


在 最 开始 针对 10 个 不 同 地 点 的 60 万 户 家 庭 进行 的 一 组 实验 中 ， 阿 尔 科 特 

(Allcott ) 发 现 ， 家 庭 能 源 报告 能 够 降低 用 电量 。 换 句 话 说， 这 项 规模 更 
大 的 、 涉 及 地 理 区 域 更 多 样 化 的 研究 所 得 出 的 结果 与 舒 尔 菊 等 人 的 结果 在 
本 质 上 是 相似 的 。 然 后 ， 在 涉及 101 个 不 同 地 点 的 800 万 户 家 庭 的 后 续 研 

究 中 ， 阿 尔 科 特 再 次 发 现 了 家 庭 能 源 报告 能 够 降低 用 电量 。 但 这 一 组 更 大 
规模 的 实验 也 揭示 了 一 个 有 趣 的 新 规律 : 在 后 来 的 实验 中 ， 家 庭 能 源 报告 
对 用 电量 的 影响 减 小 了 ( 图 4.7 ) ， 这 一 规律 在 任何 单个 的 实验 中 都 是 无 

法 被 发 现 的 。 阿 尔 科 特 推测 影响 减 小 的 原因 是 随 着 时 间 的 推移 ， 接 受 处 理 
的 参与 者 的 类 型 不 同 了 。 更 具体 地 说 ， 客 户 环保 意识 越 强 的 公用 事业 单位 
会 越 早 参与 这 一 项 目 ， 而 且 他 们 的 客户 也 会 更 积极 地 响应 。 而 随 着 客户 环 
保 意识 较 弱 的 公用 事业 单位 加 入 ， 家 庭 能 源 报告 的 影响 似乎 就 威 小 了 。 
此 ， 正 如 实验 中 的 随机 分 组 能 确保 实验 组 和 对 照 组 是 相似 的 一 样 ， 随 机 选 
择 研究 地 点 也 能 确保 研究 结论 可 以 从 一 组 参与 者 泛 化 至 更 普遍 的 总 体 ( 回 
想 一 下 第 3 章 有 关 抽 样 的 内 容 ) 。 也 就 是 说 ， 如 果 研 究 地 点 不 是 随机 抽取 


的 ， 那 么 即便 是 一 个 设计 和 实施 都 很 完美 的 实验 所 得 出 的 结论 ， 在 其 泛 化 

阶段 也 会 遇 到 问题 。 
! 上 个 月 的 邻里 比较 上 个 月 ， 你 的 用 电量 比 其 他 高 效 的 1 
1 邻居 要 少 15%. 1 
你 的 效率 等 级 
1 尔 “Fis 1 
| ad Pirie | | 
1 高 效 的 邻居 596 千瓦 时 | 
1 ts ABR 2 低 于 平均 等 ! 
ne Fi ! 
千瓦 时 : 一 个 100 瓦 的 电灯 泡 连 续 亮 10 个 小 时 则 消耗 1 千瓦 时 ， 即 1 度 电 。! 


邻里 比较 模块 


行动 方案 : 根据 你 的 用 电 情 况 和 房屋 概况 为 您 选择 的 个 性 化 方案 


速效 对 策 
立刻 就 能 做 的 事情 


巧妙 购置 
花 小 钱 省 大 钱 


调整 电视 的 显示 设置 
新 电视 起 初 } 
呈现 最 佳 的 观看 效果 而 设置 的 ， 
但 家 用 电视 通常 不 需要 这 


设置 。 


调整 电视 的 显示 设置 最 高 能 降低 
而 且 也 不 会 影 


50% 的 耗 电量 ， 

响 画面 质量 。 利用 电视 上 的 “ 
”或 “图 片 ”菜单 ， 

Ae a ke 

最 大 。 

调 上 暗 显 示 器 


寿命 。 


是 为 了 让 其 在 展厅 


CE AY 


su “x 
对 能 耗 的 影响 


;还 能 延长 电视 的 使 用 


安装 感应 开关 

总 是 记 不 住 关 灯 ? 感应 开 
关 能 在 你 离开 房间 后 自动 
将 灯 关 掉 ， 省 心 又 省 钱 。 
感应 开关 对 频繁 有 人 进出 
的 房间 (例如 我 们 的 家 ) 
和 没有 光线 的 地 方 〈 例如 
储 物 区 域 ) 来 说 是 理想 
之 选 。 

只 需 将 标准 的 照明 开关 换 
成 壁挂 式 感应 开关 即 可 ， 
后 者 在 大 多 数 五 金 店 都 能 
买 到 。 


超 棒 投资 
省 大 钱 的 大 决定 


买 一 个 新 洗衣 机 

用 洗衣 机 洗衣 服 耗 电量 
很 大 ,尤其 是 用 温水 或 
热 水 洗 。 

事实 上 ， 当 用 温水 或 热 
水 洗 时 , 90% 的 能 源 
消耗 都 是 给 水 加 热 所 产 
生 的 。 

一 些 节能 洗衣 机 的 用 水 
量 仅 是 老式 洗衣 机 的 一 
半 ， 这 就 意味 着 它 能 帮 
你 省 钱 


每 年 每 台 最 高 能 省 40 美元 


图 4.6 家 庭 能 源 
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告 包 括 一 
唯 尔 (Elsevier ) 授权 复制 自 Allcott ( 2011 ) 


每 年 最 高 能 省 30 美元 
案 模块 


行动 方 


图 4.7 111 个 测试 家 庭 能 源 报 告 对 用 电量 影响 的 实验 


项 目的 地 方 ， 家 庭 色 


Evatt cS Xt FA AS ee Be 


风 响 往往 较 小 。 


每 年 最 高 能 省 30 美元 


个 邻里 比较 模块 和 一 个 行动 方案 模块 。 经 爱 思 
i 图 1 和 图 2。 


结果 。 在 后 来 加 入 该 
阿尔 科 特 认 为 ， 这 


一 现象 主要 是 因为 用 户 环保 意识 越 强 的 地 方 会 越 蛙 加 入 这 一 项 目 。 改 编 自 


Allcott (2015) ， 图 3。 


上 述 111 个 实验 共 涉及 来 自 美国 各 地 约 850 万 户 家 庭 。 这 些 实验 均 表 明 ， 
家 庭 能 源 报 告 能 够 降低 平均 用 电量 ， 这 与 舒 尔 基 和 同事 最 初 从 加 利 福 尼 亚 
州 300 户 家 庭 那里 得 出 的 结论 是 一 样 的 。 除 此 以 外 ， 这 些 后 续 的 实验 还 表 
明 ， 家 庭 能 源 报告 对 用 电量 的 影响 力 因 地 点 而 异 。 同 时 ， 这 些 实验 也 说 明 
了 有 天 半数 字 实地 实验 的 两 个 更 普遍 的 观点 。 首 先 ， 当 开展 实验 的 成 本 较 
低 时 ， 研 究 人 员 就 能 通过 实证 来 解决 外 部 效 度 相 天 的 问题 了 。 如 果 已 经 有 
一 个 不 间断 运行 的 数据 系统 正在 对 实验 结果 进行 测量 的 话 ， 那 么 就 满足 了 
这 一 条 件 。 因 此 ， 研 究 人 员 应 该 留意 那些 已 经 在 被 记录 的 有 趣 且 重要 的 行 
为 ， 然 后 在 现 有 的 测量 基础 设施 上 设计 实验 。 其 次 ， 这 些 实验 提醒 我 们 , 
数字 实地 实验 并 非 只 能 在 线 进行 ， 我 认为 它们 会 越 来 越 普 及 ， 许 多 结果 都 
能 通过 建筑 环境 中 的 传感器 来 测量 。 


统计 结论 效 度 、 内 部 效 度 、 构 念 效 度 和 外 部 效 度 这 4 种 效 度 为 研究 人 员 提 
供 了 一 个 思考 依据 ， 有 助 于 他 们 评定 某 一 特定 实验 的 结果 是 否 能 够 证 明 一 
个 更 为 普遍 的 结论 。 相 比 于 模拟 时 代 的 实验 ， 数 字 时 代 的 实验 应 该 更 易于 
通过 实证 来 解决 外 部 效 度 的 问题 ， 同 时 也 更 易于 确保 内 部 效 度 ， 而 构 念 效 
度 的 问题 则 可 能 变 得 更 具 挑 战 性 ， 尤 其 是 在 那些 和 企业 合作 的 数字 实地 实 
验 中 。 


4.4.2 处 理 效应 的 异 质 性 


实验 通常 测量 的 是 平均 效应 ， 但 它 对 每 个 人 产生 的 效应 很 可 能 是 不 一 样 
的 。 


超越 简单 实验 的 第 二 个 关键 概念 是 处 理 效 应 的 异 质 性 。 舒 尔 泥 等 人 的 实验 
有 力 地 说 明了 同样 的 处 理 对 不 同类 型 的 人 会 产生 不 同 的 效应 ( 图 4.4 ) 。 
但 在 大 多 数 模拟 实验 中 ， 研 究 人 员 关 注 的 是 平均 处 理 效 应 ， 因 为 实验 只 有 
少量 参与 者 ， 而 且 研 究 人 员 对 他 们 也 知之 甚 少 。 而 在 数字 实验 中 ， 通 常会 
有 更 多 的 参与 者 ， 且 研究 人 员 对 他 们 的 了 解 也 更 多 。 在 这 样 一 个 不 同 的 数 
据 环境 中 ， 继 续 只 关注 平均 处 理 效 应 的 研究 人 员 就 会 错失 三 方面 的 信息 : 
一 个 处 理 是 如 何 起 作用 的 、 如 何 对 其 进行 改进 以 及 如 何 才能 让 最 有 可 能 受 
益 的 人 接受 处 理 。 因 为 这 是 要 靠 评 估 处 理 效应 的 异 质 性 才能 获得 的 信息 。 


以 下 两 个 针对 家 庭 能 源 报告 的 额外 研究 可 以 被 看 作 处 理 效应 异 质 性 的 两 个 
示例 。 在 其 中 一 项 研究 中 ， 阿 尔 科 特 按照 实施 处 理 前 的 用 电量 将 60 万 户 家 
庭 进一步 划分 为 10 个 等 级 ， 然 后 分 别 评估 了 家 庭 能 源 报告 对 它们 的 影响 。 
舒 尔 菊 等 人 发 现 了 家 庭 能 源 报 告 对 高 用 电量 居民 和 低 用 电量 居民 的 影响 存 
在 着 差异 ， 而 阿尔 科 特 则 发 现 ， 单 就 高 用 电量 居民 或 低 用 电量 居民 来 说 ， 
其 内 部 对 家 庭 能 源 报告 的 反应 也 存在 着 差异 。 例 如 ， 用 电量 最 高 的 居民 


( 即 10 个 等 级 中 最 靠 上 的 居民 ) 节约 的 电量 是 用 电量 居中 〈 就 所 有 高 用 电 
量 居民 来 说 ) 的 居民 的 两 售 (图 4.8 ) 。 此 外 ， 阿 尔 科 特 在 这 一 研究 中 还 
发 现 ， 并 不 存在 “ 飞 去 来 器 效应 ”, 即使 在 用 电量 最 低 的 居民 中 也 没 出 现 这 
一 效应 ( 图 4.8 ) 。 
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214.8 阿尔 科 特 的 研究 中 呈现 出 的 处 理 效 应 的 异 质 性 。 不 同等 级 的 用 户 节 
约 的 电量 也 不 同 。 改 编 自 Allcott (2011) ， 图 8。 


在 另 一 项 研究 中 ， 科 斯 塔 ( Costa ) 和 卡 恩 (Kahn ) 猜测 ， 家 庭 能 源 报 告 
的 有 效 性 可 能 会 因 参 与 者 的 政治 意识 形态 不 同 而 有 所 差异 ， 某 些 意识 形态 
的 参与 者 的 用 电量 可 能 还 会 因 这 一 处 理 而 增加 。 换 句 话说， 他 们 猜测 家 庭 
能 源 报告 对 某 些 类 型 的 人 可 能 会 产生 “ 《去 来 器 效应 ”。 为 了 验证 他 们 的 猜 
测 ， 科 斯 塔 和 卡 恩 将 欧 电 公司 的 数据 与 从 一 个 第 三 方 的 数据 整合 者 那里 购 
买 的 数据 进行 了 整合 ， 其 中 后 者 的 数据 包括 政党 登记 、 给 环境 组 织 的 捐赠 
以 及 可 再 生 能 源 在 家 庭 生活 中 的 使 用 等 方面 的 信息 。 通 过 整合 后 的 数据 
集 ， 科 斯 塔 和 卡 恩 发 现 ， 家 庭 能 源 报告 对 政治 意识 形态 不 同 的 参与 者 所 产 
生 的 影响 大 致 是 相似 的 ， 而 且 各 组 均 未 表现 出 “ 飞 去 来 器 效应 ”的 迹象 ( 图 
4.9). 


不 同 政治 意识 形态 组 的 处 理 效应 
支持 保守 党 

未 使 用 可 再 生 能 源 
未 向 环境 组 织 捐赠 
邻居 也 支持 保守 党 


整个 样本 的 平均 处 理 效应 
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图 4.9 科斯 塔 和 卡 恩 的 研究 中 呈现 出 来 的 处 理 效应 的 异 质 性 。 科 斯 塔 和 卡 
恩 对 整个 样本 产生 的 平均 处 理 效 应 的 估 值 是 -2.1% (-1.5%，-2.7% ) 。 将 
通过 实验 得 到 的 信息 与 家 庭 信息 合并 后 ， 他 们 利用 一 系列 统计 模型 评估 了 
对 特定 群 组 的 处 理 效应 。 每 个 群 组 都 有 两 个 估 值 ， 因 为 这 些 估 值 取 决 于 他 
们 统计 模型 中 所 包含 的 协 变量 。 正 如 该 实验 所 示 ， 处 理 效 应 可 能 会 因 人 而 
异 ， 而 利用 统计 模型 得 出 的 处 理 效应 的 估 值 也 取决 于 这 些 模型 的 细节 

( Grimmer, Messing, and Westwood 2014 ) 。 改 编 自 Costa and 

Kahn (2013) , #2340384, 


正如 这 两 个 研究 所 示 ， 数 字 时 代 让 我 们 实现 了 从 评估 平均 处 理 效 应 到 评估 
处 理 效应 的 异 质 性 的 过 渡 ， 因 为 我 们 能 拥有 更 多 的 参与 者 ， 而 且 对 他 们 有 
更 多 的 了 解 。 了 解 处 理 效应 的 异 质 性 能 让 研究 人 员 为 某 一 处 理 找到 最 有 效 
的 对 象 ， 能 提供 促进 新 理论 发 展 的 事实 ， 还 能 为 可 能 的 原理 提供 线索 ， 我 
接 下 来 就 将 介绍 原理 。 


4.4.3 原理 
实验 测量 发 生 了 什么 ， 原 理 则 解释 这 是 为 什么 以 及 如 何 发 生 的 。 


超越 简单 实验 的 第 三 个 关键 概念 是 原理 。 原 理 能 告诉 我 们 一 个 处 理 为 什么 
能 产生 影响 或 如 何 产生 影响 。 弄 清楚 原理 的 过 程 有 时 也 被 称 作 寻找 中 介 变 
量 。 尽 管 通过 实验 可 以 很 好 地 评估 因果 效应 ， 但 实验 设计 的 初 袁 往往 并 不 
是 为 了 揭示 原理 。 数 字 实验 能 以 两 种 方式 帮助 我 们 找 出 原理 : (1) 使 我 
们 能 够 搜集 更 多 的 过 程 数据 (2) 使 我 们 能 够 测试 许多 相关 的 处 理 。 


因为 很 难 正式 定义 原理 ( Hedstrém and Ylikoski 2010) ， 所 以 我 将 先 从 
一 个 简单 的 示例 开始 ， 即 青 柠 和 维生素 C 缺 乏 病 的 关系 (Gerber and 
Green 2012 ) 。 在 18 世 纪 ， 医 生 普遍 都 知道 ， 如 果 水 手 们 吃 青 柠 的 话 ， 他 
们 就 不 会 得 维生素 C 缺 乏 病 。 维 生 素 C 缺 乏 病 是 一 种 可 怕 的 疾病 ， 所 以 这 是 
一 个 非常 有 用 的 信息 。 但 医生 并 不 知道 青 柠 为 什么 能 够 预防 它 。 直 到 将 近 
200 年 后 的 1932 年 ， 科 学 家 才 证 明了 青森 之 所 以 能 预防 该 病 是 因为 含有 维 
42C (Carpenter 1988 ) 。 也 就 是 说 ， 在 该 示例 中 ， 维 生 素 C 就 是 青 柠 能 
预防 这 种 病 的 原理 ( 图 4.10 ) 。 找 出 原理 具有 很 重要 的 科学 意义 ， 许 多 科 
学 都 是 关于 理解 事情 为 什么 会 发 生 的 。 它 同时 也 具有 很 重要 的 实践 意义 ， 
一 旦 我 们 理解 了 一 个 处 理 起 作用 的 原理 ， 就 有 可 能 开发 出 效果 更 好 的 新 处 
理 方案 。 
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图 4.10 青 柠 能 够 预防 维生素 C 缺 乏 病 ， 其 原理 是 它 含 有 丰富 的 维生素 C。 


不 幸 的 是 ， 找 出 原理 是 非常 困难 的 。 不 同 于 青森 和 维生素 C 缺 乏 病 ， 在 许 
多 社会 情境 中 ， 处 理 很 可 能 是 通过 多 个 相互 关联 的 途径 产生 影响 的 。 但 在 
前 面 所 描述 的 有 关 社 会 规范 和 用 电量 的 研究 中 ， 研 究 人 员 就 试图 通过 搜集 
过 程 数据 并 测试 相关 处 理 来 找 出 原理 。 


找 出 可 能 原理 的 一 种 方法 是 搜集 某 一 处 理 如 何 影响 可 能 原理 的 过 程 数据 。 


例如 ， 阿尔 科 特 曾 指出 ， 家 庭 能 源 报告 能 够 让 人 们 减少 用 电量 。 但 这 些 报 
告 是 如 何 减少 用 电量 的 呢 ? 原理 是 什么 呢 ? 在 一 项 后 续 研究 中 ， 阿 尔 科 特 
和 罗杰斯 与 一 家 电力 公司 进行 了 合作 。 该 电力 公司 通过 一 项 回赠 活动 了 解 
了 有 哪些 用 户 将 其 家 用 电器 升级 为 更 节能 的 产品 。 通 过 这 些 信息 ， 阿 尔 科 
特 和 罗杰斯 发 现 ， 收 到 家 庭 能 源 报告 且 升 级 了 家 电 的 家 庭 数 量 仪 比 未 收 到 
报告 却 也 升级 了 家 电 的 家 庭 数量 稍微 多 一 些 ， 因 此 升级 家 电 所 节约 的 电量 
仅 占 收 到 报告 的 家 庭 所 节约 的 总 电量 的 2%。 换 句 话说， 升级 家 电 并 不 是 
家 庭 能 源 报告 降低 用 电量 的 主要 原理 。 


找 出 原理 的 第 二 种 方法 是 在 实验 中 设置 彼此 稍 有 不 同 的 处 理 。 例 如 ， 在 舒 
尔 茨 等 人 的 实验 以 及 后 续 所 有 关于 家 庭 能 源 报告 的 实验 中 ， 参 与 者 收 到 的 
家 庭 能 源 报告 ( 即 实验 处 理 ) 主要 包括 两 部 分 : (1) 节能 建议 (2) 其 
与 邻居 的 用 电量 对 比 信息 ( 图 4.6 ) 。 因 此 ， 引 起 变化 的 原因 可 能 是 节能 
建议 ， 而 不 是 与 邻居 的 对 比 信息 。 为 了 验证 这 一 可 能 性 ， 费 拉 罗 

( Ferraro ) 、 米 兰 达 (Miranda ) 和 普 赖 斯 ( Price) 与 佐治 亚 州 亚特兰大 
附近 的 一 家 水 务 公 司 合 作 开展 了 一 项 有 关节 约 用 水 的 实验 。 该 实验 涉及 了 
约 100000 户 家 庭 ， 他 们 将 这 些 家 庭 分 成 了 以 下 4 组 : 


收 到 节 水 建议 的 一 组 ; 
" 收 到 节 水 建议 以 及 一 条 呼吁 节 水 的 倡议 的 一 组 ; 


' 收 到 节 水 建议 、 一 条 呼吁 节 水 的 倡议 以 及 其 与 邻居 在 用 水 量 方面 的 对 比 信 
息 的 一 组 ; 


:未 收 到 任何 信息 的 对 照 组 。 


研究 人 员 发 现 ， 只 有 节 水 建议 的 处 理 在 短期 ( 一 年 ) 、 中 期 ( 两 年 ) 和 长 
期 ( =F) 内 对 参与 者 的 用 水 量 都 没有 影响 ; 节 水 建议 外 加 节 水 倡议 的 处 
理 能 让 参与 者 减少 用 水 量 ， 但 仅 限 于 短期 内 ; 节 水 建议 、 节 水 倡议 以 及 邻 
里 对 比 信息 的 处 理 则 在 短期 、 中 期 和 长 期 内 都 能 让 参与 者 减少 用 水 量 ( 
4.11 ) 。 采 取 分 类 处 理 的 这 类 实验 是 找 出 处 理 的 哪 一 部 分 或 哪些 部 分 是 造 

影响 的 原因 的 一 种 好 方法 ( Gerber and Green 2012, section 10.6 ) 。 例 
如 ， 费 拉 罗 和 同事 的 实验 就 表明 了 只 有 节 水 建议 是 不 能 让 参与 者 减少 用 水 
量 的 。 


理想 的 情况 是 ， 我 们 能 从 上 述 类 型 的 处 理 分 层 设 计 上 升 到 完全 析 因 设计 ， 
有 时 也 称 为 2k 析 因 设 计 。 在 该 设计 中 ， 研 究 人 员 会 对 三 个 因素 所 有 可 能 的 
组 合 都 进行 测试 ( 表 4.1 ) ， 这 样 便 能 对 每 个 因素 单独 的 效应 和 组 合 起 来 

的 效应 进行 全 面 的 评估 。 例 如 ， 费 拉 罗 和 同事 的 实验 就 没有 表明 只 有 邻里 
对 比 信息 是 否 能 帝 来 行为 的 长 期 改变 。 在 过 去 ， 开 展 完 全 析 因 实验 是 很 困 


难 的 ， 因 为 需要 大 量 的 参与 者 ， 而 且 需 要 研究 人 员 能 够 精确 地 控制 和 实施 
大 量 的 处 理 。 但 在 某 些 情形 下 ， 数 字 时 代 消 除了 这 些 组 织 实施 上 的 限制 。 


[image] 
214.11 费 拉 罗 、 米 兰 达 和 普 赖 斯 的 实验 结果 。 研 究 人 员 于 2007 年 5 月 21 
日 将 不 同 内 容 的 处 理 信息 发 出 ， 然 后 分 别 于 2007 年 、2008 年 和 2009 年 的 


夏天 测量 了 结果 。 通 过 采取 不 同类 型 的 处 理 ， 研 究 人 员 希 望 能 对 原理 有 更 
好 的 理解 。 竖 线 代 表 的 是 研究 人 员 估 计 的 置信 区 间 。 实 际 研究 材料 可 参见 
Bernedo, Ferraro, and Price ( 2014 ) 。 改 编 自 Ferraro, Miranda, and 
Price (2011) , #1. 


4.1 三 个 因素 的 完全 析 因 设计 中 的 处 理 示例 
三 个 因素 分 别 是 建议 、 倡 议和 邻里 信息 


特征 


无 处 理 


建议 


( 续 表 ) 


邻里 信息 


建议 + 倡议 


建议 + 邻里 信息 


倡议 + 邻里 信息 


建议 + 倡议 + 邻里 信息 


综 上 所 述 ， 原 理 ， 即 一 项 处 理 产生 效应 的 途径 ， 是 极其 重要 的 。 数 字 时 代 
的 实验 有 助 于 研究 人 员 通 过 搜集 过 程 数据 和 采取 完全 析 因 设计 了 解 原理 。 
然后 研究 人 员 可 以 利用 专门 用 于 测试 原理 的 实验 ， 直 接 验 证 通过 这 些 方法 
所 了 解 到 的 原理 。 


总 的 来 说 ， 效 度 、 处 理 效应 的 异 质 性 和 原理 这 三 个 概念 为 设计 和 评价 实验 
提供 了 一 个 有 力 的 框 染 。 这 些 概念 有 助 于 研究 人 员 超 越 只 针对 “什么 能 够 
起 作用 ”的 简单 实验 ， 进 而 设计 出 与 理论 联系 更 紧密 的 、 能 够 揭示 处 理 在 
何 种 情境 下 以 及 为 什么 会 产生 效应 的 丰富 实验 ， 它 们 甚至 能 帮助 研究 人 员 


设计 出 更 有 效 的 处 理 方案 。 在 这 一 有 关 实 验 的 概念 背景 下 ， 接 下 来 我 将 介 
绍 如 何 才能 开展 实验 。 


1. P 值 就 是 当 原 假设 为 真 时 所 得 到 的 样本 观察 结果 或 更 极端 的 结果 出 现 的 
概率 。 一 一 编者 注 


4.5 使 实验 成 为 现实 


即便 你 不 在 一 家 大 型 科技 公司 工作 ， 也 能 开展 数字 实验 。 你 可 以 自行 开展 
或 与 能 帮助 你 的 人 ( 以 及 你 能 帮助 的 人 ) 合作 开展 。 


在 这 一 点 上 ， 我 希望 大 家 对 自己 有 望 开 展 数字 实验 感到 兴奋 。 如 果 你 在 一 
家 大 型 科技 公司 工作 ， 那 么 这 类 实验 对 你 来 说 可 能 已 经 是 家 常 便 饭 了 。 但 
如 果 你 不 在 一 家 科技 公司 工作 ， 可 能 就 会 认为 自己 无 法 开展 这 类 实验 。 幸 
运 的 是 ， 事 实 并 非 如 此 。 只 需 一 点 创造 力 和 努力 ， 每 个 人 都 能 开展 数字 实 


验 。 


首先 ， 区 分 自行 开展 和 与 有 能 力 的 人 合作 开展 这 两 种 主要 方式 是 很 有 帮助 
的 。 而 且 自行 开展 实验 也 有 几 种 不 同 的 方式 : 利用 现 有 环境 开展 实验 、 创 
建 自己 的 实验 或 是 创建 自己 的 产品 以 进行 反复 实验 。 通 过 下 面 的 例子 你 可 
以 看 出 ， 这 些 方法 中 并 不 存在 对 所 有 情形 都 最 适用 的 方法 ， 最 好 是 将 它们 
看 作 在 成 本 、 控 制 、 真 实 和 道德 伦理 这 4 个 主要 维度 上 各 有 利弊 的 方法 
(图 4.12 ) 。 


成 本 控制 真实 道理 伦理 
利用 现 有 环境 低 低 高 ”有 可 能 很 复杂 


自行 开展 一 > 创建 自己 的 实验 FE à PE ANNE 


4 ~ 创建 自己 的 产品 高 高 高 。 ”相对 简单 
使 实验 成 
为 现实 
与 有 能 力 低 中 等 
的 人 合作 


高 有 可 能 很 复杂 


图 4.12 各 种 开展 实验 的 方式 的 利弊 总 结 。 成 本 ， 是 指 研究 人 员 所 花费 的 

时 间 和 金钱。 控制 ， 是 指 在 招募 参与 者 、 随 机 分 组 、 实 施 处 理 和 测量 结果 
方面 做 你 想 做 的 事情 的 能 力 。 真实 ， 是 指 实验 环境 与 日 常生 活 中 所 遇 到 的 
情形 相 匹 配 的 程度 ; 需 注 意 的 是 ， 高 匹配 程度 对 验证 理论 来 说 并 不 总 是 重 
要 的 (Falk and Heckman 2009 ) 。 道 德 伦理 ， 是 指 拥有 好 的 出 发 点 的 研 
究 人 员 应 对 可 能 出 现 的 道德 伦理 挑战 的 能 力 。 


4.5.1 利用 现 有 环境 开展 实验 


你 可 以 在 现 有 环境 中 开展 实验 ， 这 通常 无 须 进行 任何 编码 或 与 别人 合作 。 


从 逻辑 上 讲 ， 开 展 一 项 数字 实验 ， 最 简单 的 方法 就 是 在 现 有 环境 的 基础 上 
开展 实验 。 采 取 这 一 方式 可 以 开展 相当 大 规模 的 实验 ， 且 无 须 与 企业 合作 
或 是 进行 大 量 的 软件 开发 。 


例如 ， 珍妮 弗 : 多 里 亚 克 (Jennifer Doleac ) 和 卢 克 .斯 泰 因 (Luke Stein ) 
就 曾 利用 一 个 类 似 于 克 雷 格 列表 网 ( Craigslist ) 的 在 线 商 城 开 展 了 一 项 骨 
在 测量 种 族 歧视 的 实验 。 在 实验 中 ， 他 们 为 上 干 个 音乐 播放 器 做 广告 宣 
传 ， 然 后 通过 系统 地 改变 卖家 的 特征 研究 了 种 族 对 经 济 交 易 的 影响 。 此 
外 ， 他 们 还 借助 实验 的 规模 评估 了 什么 时 候 该 影响 会 更 大 ( 处 理 效应 的 异 
质 性 ) ， 并 对 该 影响 产生 的 可 能 原因 (原理 ) 给 予 了 一 些 解 释 。 


多 里 亚 克 和 斯 泰 因 的 音乐 播放 器 广告 主要 在 三 个 方面 存在 着 差异 。 首 先是 
卖家 的 特征 不 同 ， 表 现在 照片 中 拿 音 乐 播放 器 的 手 的 不 同 (肤色 是 白 的 、 
黑 的 、 白 的 且 有 文身 ， 见 图 4.13 ) 。 其 次 是 要 价 不 同 (90 美 元 、110 美 
元 、130 美 元 ) 。 最 后 是 广告 内 容 的 质量 的 不 同 (高 质量 和 低 质 量 ， 例 如 
单词 是 否 有 大 小 写 和 拼写 方面 的 错误 ) 。 因 此 ， 广 告 采 用 了 3x3x 2 的 设 
计 ， 并 被 投放 到 了 从 小 城市 (例如 印第安 纳 州 的 科 科 莫 和 内 布 拉 斯 加 州 的 
北 普 拉 特 ) 到 大 都 市 ( 例如 纽约 和 洛杉矶 ) 300 多 个 地 方 的 当地 市 场 中 。 
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图 4.13 多 里 亚 克 和 斯 泰 因 实验 中 手 的 照片 。 为 了 衡量 在 线 商城 中 存在 的 
种 族 歧 视 ， 音 乐 播放 器 分 别 由 具有 不 同 特征 的 卖家 出 售 。 经 约翰 : 威 利 父子 
出 版 公司 (John Wiley and Sons ) 许可 复制 自 Doleac and 

Stein (2013) ， 图 1。 


总 的 来 说 ， 白 人 卖家 的 销售 情况 比 黑人 卖家 的 要 好 ， 有 文身 的 卖家 的 销售 
情况 则 居中 。 例 如 ， 白 人 卖家 的 音乐 播放 器 有 更 多 的 买 家 ， 且 其 最 终 的 成 
交 价 也 较 高 。 除 了 这 些 平均 效应 以 外 ， 多 里 亚 克 和 斯 泰 因 还 评估 了 效应 的 
异 质 性 。 例 如 ， 早 期 理论 的 一 个 预测 是 ， 在 买 家 竞争 越 激烈 的 市 场 ， 歧 视 
会 越 少 。 通 过 将 市 场 中 买 家 出 价 的 次 数 作为 衡量 买 家 竞争 程度 的 指标 ， 研 
究 人 员 发 现 ， 在 买 家 竞争 程度 较 低 的 市 场 ， 黑 人 卖家 收 到 的 出 价 确实 较 少 
也 较 低 。 此 外 ， 通 过 对 比 高 质量 广告 和 低 质量 广告 的 播放 器 销售 情况 ， 多 
里 亚 克 和 斯 泰 因 发 现 ， 广 告 质量 对 黑人 卖家 和 有 文身 的 卖家 所 受到 的 歧视 
没有 影响 。 最 后 ， 借 助 广告 投放 范围 包含 300 多 个 市 场 这 一 优势 ， 研 究 人 
员 发 现 ， 黑 人 卖家 在 犯罪 率 和 居住 隔离 程度 均 偏 高 的 城市 受到 的 歧视 也 会 
更 多 。 这 些 结果 均 无 法 准确 地 解释 为 什么 黑人 卖家 的 销售 情况 会 较 差 ， 但 
是 ， 如 果 将 这 些 结果 与 其 他 研究 结果 相 结 合 ， 研 究 人 员 便 能 对 不 同类 型 的 
经 济 交易 中 种 族 歧 视 的 原因 给 出 一 些 理论 上 的 解释 了 。 


另外 一 个 表明 研究 人 员 可 以 利用 现 有 系统 开展 数字 实地 实验 的 例子 是 阿尔 
努 . 范 德里 杰 特 和 同事 在 2014 年 针对 成 功 的 天 键 的 研究 。 在 生活 的 许多 方 

面 看 似 相似 的 人 ， 其 最 终 的 发 展 结果 会 截然 不 同 。 对 此 ， 一 个 可 能 的 解释 
是 ， 一 个 人 所 具有 的 小 且 基 本 随机 的 优势 会 一 直 伴随 着 他 并 随 着 时 间 的 推 
移 而 增长 ， 这 一 过 程 被 研究 人 员 称 为 优势 累积 。 为 了 确定 起 初 微小 的 成 功 
会 一 直 存 在 还 是 会 逐渐 消失 ， 范 德里 杰 特 和 同事 对 4 个 不 同 的 系统 进行 了 

干预 ， 即 让 随机 选中 的 参与 者 获得 相应 的 成 功 ， 然 后 测量 这 些 随 机 分 配 的 
成 功 的 后 续 影响 。 


更 具体 地 说 ， 他 们 对 以 下 4 个 系统 进行 了 干预 : (1) 在 众 筹 网 站 
Kickstarter 上 ， 范 德里 杰 特 和 同事 投资 了 随机 选择 的 项 目 ; (2) 在 产品 点 
评 网 站 Epinions 上 ， 他 们 正面 评价 了 随机 选择 的 评论 ; (3) 在 维基 百科 
上 ， 他 们 奖励 了 随机 选择 的 贡献 者 ; (4) 在 请 愿 网 站 Change.org 上 ,他 
们 在 随机 选择 的 请 愿 书 上 签 下 了 自己 的 名 字 。 然 后 他 们 在 4 个 系统 中 均 发 
现 了 极为 相似 的 结果 : 与 原本 毫 无 区 别 的 同一 个 系统 的 其 他 用 户 相 比 ， 在 
起 始 阶 段 被 随机 选中 并 获得 相应 成 功 的 参与 者 ， 其 后 续 的 成 功 也 会 更 多 
(图 4.14 ) 。 许 多 系统 中 都 存在 着 这 样 的 规律 ， 这 便 增 加 了 上 述 结果 的 外 
部 效 度 ， 因 为 这 一 事实 降低 了 这 个 规律 只 是 某 一 特定 系统 产物 的 可 能 性 。 
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图 4.14 4 个 不 同系 统 中 随机 分 配 的 成 功 的 长 期 效应 。 (1 ) 在 众 筹 网 站 
Kickstarter 上 ， 范 德里 杰 特 和 同事 投资 了 随机 选择 的 项 目 ; (2) 在 产品 点 
评 网 站 Epinions 上 ， 他 们 正面 评价 了 随机 选择 的 评论 ; (3) 在 维基 百科 


上 ， 他 们 奖励 了 随机 选择 的 贡献 者 ; (4) 在 请 愿 网 站 change.org 上 ， 他 
们 在 随机 选择 的 请 愿 书 上 签 下 了 自己 的 名 字 。 改编 自 van de Rijt et al. 
(2014) ， 图 2。 


这 两 个 例子 表明 ， 研 究 人 员 在 不 与 企业 合作 或 不 构建 复杂 数字 系统 的 情况 
下 ， 也 能 开展 数字 实地 实验 。 此 外 ， 表 4.2 列 出 了 更 多 的 实验 ， 用 以 说 明 
研究 人 员 在 利用 现 有 系统 的 基础 设施 来 实施 处 理 、 测 量 结果 方面 有 着 哪些 
可 能 性 。 对 研究 人 员 来 说 ， 这 些 实验 的 成 本 相对 较 低 ， 且 较 贴近 真实 生 
活 ， 但 其 对 参与 者 、 处 理 和 需要 测量 的 结果 的 掌控 程度 有 限 。 此 外 ， 对 于 
仅 通过 一 个 系统 开展 的 实验 ， 研 究 人 员 需 要 注意 ， 实 验 的 处 理 效应 可 能 是 
在 该 系统 特有 的 机 制 〈 例如 Kickstarter 对 项 目的 排序 方式 或 Change.org 对 
请 愿 书 的 排序 方式 ， 更 多 内 容 可 参见 第 2 章 的 算法 干扰 ) 的 推动 下 产生 
的 。 最 后 ， 当 研究 人 员 利 用 正在 运行 的 系统 开展 实验 时 ， 会 遇 到 一 些 来 手 
的 道德 伦理 问题 ， 有 可 能 会 对 参与 者 、 非 参与 者 和 系统 造成 伤害 。 第 6 章 
将 更 详细 地 探讨 这 些 道德 伦理 问题 ， 同 时 范 德 里 杰 特 的 研究 附录 对 此 也 进 
行 了 很 好 的 讨论 。 但 这 些 利用 现 有 系统 开展 实验 的 权衡 取舍 并 不 适用 于 所 
有 项 目 ， 因 此 正如 我 即将 介绍 的 ， 有 些 研究 人 员 会 创建 自己 的 实验 系统 。 


表 4.2 在 现 有 系统 中 开展 实验 的 示例 


Restivo and van de Rijt ( 


谷 仓 之 星 对 人 们 编辑 维基 百科 的 贡献 的 影响 
ae - dé van de Rijtet al.( 2014) 


反 骚 扰 信 息 对 种 族 主义 推 文 的 影响 Munger( 2016 ) 


拍卖 方式 对 成 交 价 的 影响 Lucking-Reiley( 1999 ) 


声誉 对 在 线 拍卖 价格 的 影响 Resnick et al. ( 2006 ) 


卖家 的 种 族 对 其 在 易 贝 上 拍卖 棒球 卡 的 影响 | Ayres, Banaji, and Jolls (2015 ) 


卖家 的 种 族 对 其 出 售 的 音乐 播放 器 的 销量 


影响 


Doleac and Stein ( 2013 ) 


Fe PI ( Airbnb ) 上 租 客 的 种 族 对 其 租金 的 


影响 Edelman, Luca, and Svirsky( 2016 ) 
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众 筹 网 站 Kickstarter - AAR IM A pk TH 


影 啊 


van de Rijt et al.( 2014) 


所 属 种 族 对 住房 租金 的 影响 Hogan and Berry ( 2011 ) 


产品 点 评 网 Epinions 上 的 好 评 对 日 后 评价 的 


影响 


van de Rijt et al. ( 2014 ) 


Vaillant et al. (2015) ; van de Rijt et 


签名 对 请 愿 成 功 的 影响 
al. (2014 ) ; van de Rijt et al. (2016 ) 


4.5.2 创建 自己 的 实验 
创建 自己 的 实验 可 能 需要 很 高 的 成 本 ， 但 能 使 你 开展 自己 想 要 的 实验 。 


除了 利用 现 有 环境 开展 实验 以 外 ， 大 家 还 可 以 创建 自己 的 实验 。 该 方法 主 
要 的 优势 是 可 控 性 ， 也 就 是 说 ， 如 果 你 自行 创建 实验 的 话 ， 就 可 以 创建 自 
己 想 要 的 环境 和 处 理 。 这 些 定制 的 实验 环境 可 以 为 测试 那些 在 自然 环境 中 
无 法 测试 的 理论 创造 机 会 。 但 创建 自己 的 实验 也 有 次 端 ， 最 主要 的 就 是 成 
本 可 能 会 很 高 ， 而 且 你 所 创建 的 环境 可 能 无 法 具有 自然 存在 的 系统 的 真实 
性 。 此 外 ， 创 建 自 己 的 实验 的 研究 人 员 还 必须 有 招募 参与 者 的 策略 。 在 利 
用 现 有 系统 开展 实验 时 ， 研 究 人 员 基 本 上 是 将 实验 通过 系统 顺便 带 给 了 参 
与 者 。 但 如 果 是 创建 自己 的 实验 ， 研 究 人 员 则 需要 招募 参与 者 参加 实验 。 
幸运 的 是 ， 像 机 器 人 MTurk 这 样 的 服务 平台 为 研究 人 员 招 募 实验 参与 者 提 
供 了 便利 的 渠道 。 


可 被 用 来 说 明定 制 环 境 在 测试 抽象 理论 方面 优势 的 例子 是 格雷 戈 里 . 休 伯 

( Gregory Huber) 、 塞 思 . 希 尔 〈Seth Hill) 和 加 布 里 埃 尔 : 伦 兹 ( Gabriel 
Lenz ) 2012 年 的 数字 实验 室 实验 。 该 实验 探究 了 民主 治理 可 能 存在 的 实际 
限制 。 早 期 针对 实际 选举 的 非 实 验 性 研究 表明 ， 选 民 无 法 对 现任 执政 者 的 
表现 进行 准确 的 评估 。 有 具体 来 说 ， 选 民 似乎 会 因 以 下 三 个 因素 而 在 评估 时 
出 现 偏 差 : ( 1 ) 他 们 关注 的 是 现任 执政 者 近期 而 非 一 直 以 来 的 表现 ; 
(2 ) 他 们 可 能 会 被 华而不实 的 言论 、 评 陷 和 营销 信息 所 操纵 ; (C3) 他 们 
可 能 会 被 与 现任 执政 者 政绩 无 关 的 事件 所 影响 ， 例 如 当地 运动 队 的 获胜 或 
天 气 。 但 在 这 些 早期 的 研究 中 ， 研 究 人 员 很 难 将 上 述 任何 一 个 因素 与 真实 
复杂 的 选举 中 的 其 他 事情 隔离 开 来 。 因 此 ， 休 伯 和 同事 创建 了 一 个 高 度 简 
化 的 投票 环境 ， 以 将 上 述 三 种 偏差 分 别 隔离 出 来 ， 然 后 对 其 进行 实验 研 


a 
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下 述 实验 设置 听 起 来 很 不 真实 ， 但 大 家 需要 记 住 的 是 ， 真 实 并 不 是 实验 室 
实验 的 一 个 目标 。 实 验 室 实 验 的 目标 是 将 你 试图 研究 的 过 程 明 确 地 隔离 出 
来 ， 在 更 真实 的 研究 中 ， 这 一 目标 有 时 反倒 难以 实现 了 (Falk and 
Heckman 2009 ) 。 此 外 ， 在 休 伯 和 同事 的 研究 中 ， 他 们 认为 ， 如 果 选 民 
在 其 创建 的 高 度 简 化 的 环境 中 无 法 有 效 评估 执政 者 的 政绩 ， 那 么 他 们 在 更 
真实 、 更 复杂 的 环境 中 就 更 没 办 法 有 效 评估 了 。 


休 伯 和 同事 是 通过 机 器 人 MTurk 招 募 参 与 者 的 。 只 要 参与 者 签署 了 知情 同 
意 书 并 通过 一 个 简短 测试 ， 就 会 被 告知 他 正在 参与 一 项 共有 32 轮 的 游戏 ， 
通过 游戏 就 能 赢 取 可 兑换 现金 的 代 币 。 在 游戏 开始 时 ， 每 个 参与 者 会 被 告 
知 他 有 一 个 分 配器 ， 该 分 配器 会 在 每 轮 游戏 中 免费 给 他 发 放 代 币 ， 并 告诉 
他 有 的 分 配器 发 放 的 代 币 要 多 于 其 他 分 配器 。 此 外 ， 每 个 参与 者 还 会 被 告 
知 ， 在 16 轮 游戏 后 ， 他 将 有 机 会 选择 是 继续 保留 现 有 的 分 配器 还 是 要 求 重 
新 分 配 一 个 分 配器 。 鉴 于 大 家 已 经 了 解 了 休 伯 和 同事 的 研究 目标 ， 所 以 你 
们 应 该 明白 了 ， 这 里 的 分 配器 代表 的 就 是 一 个 政府 ，16 轮 游戏 后 的 选择 代 
表 的 就 是 选举 ， 但 参与 者 并 未 意识 到 研究 的 目标 。 休 伯 和 同事 共 招募 了 约 
4000 名 参与 者 ， 每 名 参与 者 在 完成 这 项 大 约 需 8 分 钟 的 任务 后 会 获得 1.25 
美元 的 酬劳 。 


正如 前 面 提 到 的 ， 早 期 研究 的 一 个 发 现 是 ， 选 民 会 因 执 政 者 完全 无 法 掌控 
的 事情 ， 例 如 当地 运动 队 的 胜利 或 天 气 ， 对 其 政绩 做 出 过 高 或 过 低 的 评 

估 。 为 了 评估 参与 者 的 选择 是 否 会 受到 其 所 在 环境 中 完全 随机 的 事件 的 影 
响 ， 休 伯 和 同事 在 实验 中 增加 了 抽奖 环节 ， 即 在 第 8 轮 或 第 16 轮 游戏 时 ， 

参与 者 会 进行 一 次 随机 抽奖 ， 其 中 有 些 人 会 赢 5000 分 ， 有 些 人 赢 0 分 ， 有 
些 人 则 输 5000 分 。 休 伯 和 同事 旨 在 用 这 一 抽奖 环节 来 模拟 那些 与 执政 者 政 
绩 无 关 的 好 的 或 坏 的 消息 。 尽 管 参与 者 被 明确 告知 ， 抽 奖 与 他 们 的 分 配器 
表现 无 关 ， 但 抽奖 结果 还 是 会 影响 参与 者 的 选择 。 在 抽奖 中 赢 了 5000 分 的 


参与 者 更 有 可 能 保留 其 分 配器 ， 而 且 相 比 于 将 抽奖 设置 在 第 8 轮 ， 将 其 设 
置 在 第 16 轮 时 ( 刚好 在 选择 是 否 更 换 分 配器 之 前 ) 这 一 影响 会 更 加 明显 
(图 4.15 ) 。 根 据 这 些 结果 和 其 论文 中 其 他 几 项 实验 的 结果 ， 休 伯 和 同事 
得 出 结论 ， 即 便 在 简化 的 环境 中 ， 选 民 也 难以 做 出 明智 的 决定 ， 这 一 结论 
影响 了 日 后 关于 选民 决策 的 其 他 研究 (Healy and Malhotra 2013), {À 
伯 和 同事 的 实验 表明 ， 机 器 人 MTurk 可 被 用 来 为 旨 在 准确 测试 非常 具体 的 
理论 的 实验 室 实验 招募 参与 者 。 这 个 实验 同时 也 说 明了 创建 自己 的 实验 环 
境 的 价值 : 很 难 想象 在 其 他 环境 中 如 何 将 这 些 因 素 如 此 明确 地 隔离 出 来 。 
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图 4.15 休 伯 、 和 希 尔 和 伦 兹 的 实验 结果 。 在 抽奖 中 赢 了 5000 分 的 参与 者 更 
有 可 能 保留 其 分 配器 ， 而 且 相 比 于 将 抽奖 设置 在 第 8 轮 ， 将 其 设置 在 第 16 
轮 时 这 一 影响 会 更 加 明显 。 改 编 自 Huber, Hill, and Lenz (2012) ， 图 5。 


除了 创建 类 似 实 验 室 的 实验 环境 ， 研 究 人 员 还 能 创建 更 贴近 现实 的 实验 环 
境 。 例 如 ， 和 森 托 拉 ( Centola ) 就 构建 了 一 个 数字 实地 环境 ， 以 研究 社交 

网 络 结构 对 行为 传播 的 影响 。 他 研究 的 问题 需要 他 观察 同一 行为 在 多 个 群 
体内 (这些 群体 仅 在 社交 网 络 结构 方面 存在 着 差异 ， 其 他 方面 基本 一 致 ) 
的 传播 。 要 想 做 到 这 一 点 ， 唯 一 的 方法 就 是 创建 一 个 定制 实验 。 在 这 种 情 
况 下 ， 和 森 托 拉 创 建 了 一 个 基于 网 络 的 健康 社区 。 


森 托 拉 在 健康 网 站 上 发 布 广告 ， 招 莫 了 约 1500 名 参与 者 。 当 参与 者 进入 被 
称 为 “健康 生活 方式 网 ”的 在 线 社 区 时 ， 他 们 需 签 署 知情 同意 书 ， 然 后 森 托 
拉 会 为 其 分 配 * 健 康 伙伴 ”。 和 森 托 拉 分 配 健康 伙伴 的 方式 使 他 能 够 在 不 同 群 
组 内 构建 不 同 的 社交 网 络 结构 : 有 些 群 组 是 随机 网 络 ( 即 每 个 人 被 选 为 健 
康 伙伴 的 概率 是 一 样 的 ) ， 其 他 群 组 则 是 集群 网 络 ( 即 有 些 人 被 选 为 健康 
伙伴 的 概率 要 大 一 些 ) 。 然 后 ， 和 森 托 拉 在 每 个 网 络 中 引入 了 一 种 新 的 行 
为 : 注册 一 个 拥有 额外 健康 信息 的 新 网 站 的 机 会 。 每 当 有 人 注册 这 个 新 网 
站 时 ， 他 所 有 的 健康 伙伴 都 会 收 到 关于 他 注册 行为 的 一 封 电 子 邮 件 。 森 托 
拉 发 现 ， 相 比 于 随机 网 络 ， 注 册 新 网 站 的 行为 在 集群 网 络 中 传播 得 更 远 、 
更 快 。 这 一 发 现 与 现 有 的 一 些 理论 相悖 。 


总 的 来 说 ， 创 建 自己 的 实验 能 让 你 有 更 多 的 掌控 力 ， 能 让 你 构建 出 最 有 利 
于 隔离 研究 对 象 的 环境 。 我 很 难 想象 上 述 两 个 实验 在 现 有 的 环境 中 该 如 何 
开展 。 此 外 ， 创 建 自己 的 系统 还 能 减少 利用 现 有 环境 开展 实验 所 面临 的 道 
德 伦理 问题 。 但 创建 自己 的 实验 也 会 遇 到 实验 室 实验 所 面临 的 许多 问题 ， 
比如 招募 参与 者 和 对 真实 性 的 担心 。 尽 管 实验 可 以 在 相对 简单 的 环境 中 进 
行 〈 例 如 休 伯 、 和 希 尔 和 伦 效 针对 选举 的 研究 ) ， 也 可 以 在 相对 复杂 的 环境 
中 进行 〈 例 如 和 森 托 拉 针 对 网 络 和 传播 的 研究 ) ， 但 创建 自己 的 实验 还 有 最 
后 一 个 缺点 ， 那 就 是 可 能 会 既 费 钱 又 费时 。 


4.5.3 创建 自己 的 产品 


创建 自己 的 产品 是 一 种 高 风险 、 高 回报 的 方法 。 但 如 果 成 功 了 ， 就 能 帝 来 
正 反馈 循环 ， 使 你 能 够 开展 与 众 不 同 的 研究 。 


有 些 研究 人 员 会 在 创建 自己 的 实验 这 一 方法 上 更 进一步 ， 进 而 创建 自己 的 
产品 。 这 些 产品 会 吸引 用 户 ， 然 后 便 成 了 开展 实验 和 其 他 类 型 研究 的 平 
台 。 例 如 ， 明尼苏达 大 学 的 一 组 研究 人 员 就 创建 了 MovieLens ( 意 为 “电影 
镜头 ”) ， 一 个 免费 的 、 非 商业 性 质 的 、 个 性 化 的 电影 推荐 网 站 。 自 1997 
年 以 来 ， MovieLens 一 直 在 和 运营， 在 此 期 间 ， 网 站 搜集 了 25 万 名 注册 用 户 
针对 3 万 多 部 电影 的 2000 多 万 条 评分 数据 (Harper and Konstan 2015 ) 。 
研究 人 员 利 用 MovieLens 的 活跃 用 户 群体 开展 了 一 系列 精彩 的 研究 ， 从 测 
试 有 关公 共产 品 捐款 的 社会 科学 理论 到 处 理 推荐 系统 所 面临 的 算法 挑战 。 
(有 关 这 些 研究 的 全 面 性 的 回顾 ， 可 参阅 Harper and Konstan 2015 ) 。 
如 果 研 究 人 员 没 有 这 样 一 个 他 们 能 够 完全 掌控 的 实际 运行 的 产品 ， 那么 这 
些 实验 中 的 许多 实验 都 将 无 法 开展 。 


不 幸 的 是 ， 创 建 自 己 的 产品 是 非常 困难 的 ， 这 就 像 是 在 创办 一 家 公司 一 
样 : 高 风险 、 高 回报 。 如 果 成 功 了 ， 就 对 实验 的 掌控 力 来 说 ， 利 用 这 一 方 
法 所 开展 的 实验 和 创建 自己 的 实验 基本 是 一 样 的 ; 就 真实 性 和 招募 参与 者 
来 说 ， 利 用 这 一 方法 开展 实验 和 利用 现 有 环境 开展 实验 是 一 样 的 。 此 外 , 
这 一 方法 可 能 会 带 来 正 反 馈 循 环 ， 即 更 多 的 研究 会 让 产品 变 得 更 好 ， 更 好 
的 产品 会 吸引 更 多 的 用 户 ， 有 了 更 多 的 用 户 便 可 以 开展 更 多 的 研究 ， 以 此 
类 推 (图 4.16 ) 。 换 句 话 说 ， 一 旦 正 反 馈 循 环 开始 了 ， 研 究 就 会 变 得 越 来 
越 容 易 。 尽 管 这 个 方法 目前 来 说 非常 困难 ， 但 我 希望 随 着 技术 的 改进 ， 它 
将 变 得 更 加 实用 。 然 而 在 那 之 前 ， 如 果 研 究 人 员 想 要 利用 一 个 产品 ， 更 直 
接 的 策略 是 与 一 个 公司 合作 ， 这 也 是 我 接 下 来 要 讲 的 话题 。 
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图 4.16 如 果 你 能 成 功 创建 自己 的 产品 ， 便 能 受益 于 正 反 馈 循 环 : 研究 能 
让 产品 变 得 更 好 ， 这 样 便 能 吸引 更 多 的 用 户 ， 有 了 更 多 的 用 户 便 能 开展 更 
多 的 研究 。 这 类 型 的 正 反馈 循环 是 非常 难 实现 的 ， 但 它 能 让 研究 人 员 开 展 
之 前 不 可 能 的 实验 。MovieLens 就 是 一 个 成 功 创造 了 正 反馈 循环 的 研究 事 
例 ( Harper and Konstan 2015 ) 。 


4.5.4 与 有 能 力 的 组 织 合 作 


合作 可 以 降低 成 本 、 扩 大 规模 ， 但 也 可 能 会 改变 你 所 能 使 用 的 参与 者 、 处 
理 和 结果 。 


除了 自己 做 ， 还 有 一 种 方法 是 与 一 个 有 能 力 的 组 织 合作 ， 例 如 企业 、 政 府 
或 非 政府 组 织 。 这 样 做 的 优点 是 这 些 组 织 能 让 你 开展 那些 你 自己 无 法 开展 
的 实验 。 例 如 ， 后 文 有 一 个 实验 共有 6100 万 名 参与 者 ， 这 是 任何 一 个 研究 
人 员 都 无 法 单独 实现 的 规模 。 合 作 能 让 你 开展 之 前 不 可 能 开展 的 实验 ， 但 
同时 也 会 限制 你 。 例 如 ， 大 多 数 公 司 都 不 会 允许 你 开展 可 能 有 损 他 们 生意 
或 声誉 的 实验 。 合 作 还 意味 着 在 你 发 表 研究 论文 时 ， 可 能 会 被 要 求 “重新 
调整 研究 结果 ， 而 且 如 果 你 的 论文 不 利于 他 们 的 话 ， 有 些 合 作者 甚至 可 
能 竭力 阻止 你 发 表 论文 。 最 后 ， 合 作 还 意味 着 需要 成 本 去 发 展 并 维护 这 些 
合作 关系 。 


与 有 能 力 的 组 织 建立 合作 关系 需 解决 的 核心 挑战 是 找到 一 个 平衡 双方 利益 
的 方法 ， 巴 斯 德 象 限 是 对 此 有 帮助 的 一 个 方法 ( Stokes 1997 ) 。 许 多 研 
究 人 员 认 为 ， 如果 他 们 研究 的 是 某 个 组 织 可 能 感 兴趣 的 东西 ， 那 么 他 们 就 
不 是 在 做 真正 的 科学 研究 。 这 种 心态 会 让 成 功 建立 合作 关系 变 得 非常 困 
难 ， 而 且 这 也 是 完全 错误 的 。 生 物 学 家 路 易 : 巴 斯 德 ( Louis Pasteur ) 的 这 
项 开创 性 的 研究 可 以 完美 诠释 该 思维 方式 的 问题 所 在 。 当 时 巴 斯 德 被 一 家 
酒精 制造 三 邀请 去 研究 将 甜菜 汁 转化 为 酒精 的 发 酵 过 程 ， 在 此 期 间 ， 他 发 
现 了 一 种 新 型 微生物 ， 并 由 此 最 终 提 出 了 疾病 细菌 学 说 。 新 型 微生物 的 发 
现 解决 了 一 个 非常 实际 的 问题 ， 既 帮助 改善 了 发 酵 过 程 ， 同 时 又 促使 科学 
向 前 近 了 一 大 步 。 因 此 ， 与 其 认为 有 实际 用 途 的 研究 与 真正 的 科学 研究 存 
在 冲突 ， 不 如 将 它们 看 作 两 个 独立 的 维度 。 研 究 的 出 发 点 可 以 是 ( 或 不 
是 ) 实用 的 ， 也 可 以 是 (或 不 是 ) 寻求 基本 的 认识 。 重 要 的 是 ， 有 些 研 
究 ， 就 比如 巴 斯 德 的 研究 ， 既 是 为 了 解决 实际 问题 也 是 为 了 寻求 基本 认识 
(图 4.17 ) 。 属 于 巴 斯 德 象限 中 的 研究 ， 即 本 身 就 具有 两 个 目标 的 研究 ， 
是 研究 人 员 和 各 组 织 合作 的 理想 之 选 。 在 此 背景 下 ， 我 将 描述 两 种 合作 开 
展 的 实验 研究 : 一 种 是 与 企业 合作 ， 一 种 是 与 非 政府 组 织 合 作 。 


大 型 公司 ， 尤 其 是 科技 公司 ， 已 为 开展 复杂 实验 开发 了 相当 精密 的 、 先 进 
的 基础 设施 。 在 科技 行业 ， 这 类 型 实验 通常 被 称 为 A/B 测 试 ， 因 为 它们 会 
比较 A、B 两 项 处 理 的 有 效 性 。 为 了 增加 广告 点 击 率 等 目的 ， 这 些 公司 会 利 
用 其 先进 的 实验 基础 设施 来 开展 A/B 测 试 ， 但 这 些 设施 也 可 以 被 用 来 开展 
促进 科学 认识 的 研究 。 能 够 说 明 这 类 研究 可 能 性 的 一 个 例子 是 脸谱 网 和 加 
州 大 学 圣迭戈 分 校 的 研究 人 员 针 对 不 同 信息 对 选民 投票 率 的 影响 而 合作 开 
展 的 一 项 研究 (Bond et al. 2012), 


[image] 


图 4.17 巴 斯 德 象限 。 与 其 认为 研究 只 能 是 “基础 的 ?或 “应 用 的 ”， 不 如 将 其 
看 作 既 是 ( 或 不 是 ) 为 了 解决 实际 问题 也 是 ( 或 不 是 ) 为 了 寻求 基本 认 

识 。 巴 斯 德 针对 将 甜菜 汁 转化 为 酒精 的 研究 ， 提 出 了 疾病 细菌 学 说 ， 这 就 
是 一 个 既 为 解决 实际 问题 又 为 寻求 基本 认识 的 研究 示例 。 这 类 研究 是 最 适 


合 与 有 能 力 的 组 织 合 作 开展 的 研究 。 为 了 解决 实际 问题 而 不 是 寻求 基本 认 
识 的 研究 示例 是 托马斯 -爱迪生 ( Thomas Edison) 的 研究 ， 为 了 寻求 基本 
认识 而 不 是 解决 实际 问题 的 研究 示例 是 尼 尔 斯 : 玻 尔 ( Niels Bohr ) 的 研 
究 。 改 编 自 Stokes ( 1997 ) ， 图 3.5。 


2010 年 11 月 2 日 美国 国会 中 期 选举 这 天 ， 居 住 在 美国 且 年 龄 在 18 岁 及 以 上 
的 6100 万 名 脸谱 网 用 户 参与 了 一 项 关于 投票 的 实验 。 这 些 用 户 在 访问 脸谱 
网 时 会 被 随机 分 配 到 三 个 组 中 ， 然 后 系统 会 根据 分 组 情况 向 其 信息 流 顶 部 
推送 不 同 的 标语 ( 如果 有 的 话 ) (图 4.18 ) 。 


.对 照 组 ; 


有关 投 票 的 信息 性 消息 + 一 个 可 点 击 的 “我 已 投票 ”按钮 + 一 个 计数 器 〈 信 
息 组 ) ; 


有关 投 票 的 信息 性 消息 + 一 个 可 点 击 的 “我 已 投票 ”按钮 + 一 个 计数 器 + 已 
点 击 “ 我 已 投票 ”的 朋友 的 姓名 和 照片 (信息 十 社交 组 ) 。 
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214.18 脸谱 网 上 一 项 动员 票 的 实验 结果 。 信息 组 的 参与 者 实际 投票 
概率 与 对 照 组 的 参与 者 相同 ， 但 信息 上 + 社交 组 的 参与 者 实际 & 票 的 概率 出 
要 稍 大 一 些 。 坚 线 代表 估算 的 95% 的 置信 区 间 ，。 该 图 中 的 结果 来 自 与 实际 
投票 记录 进行 匹配 的 约 600 万 名 参与 者 。 改 编 自 Bond et al. (2012) , 
1, 


#64 (Bond ) 和 同事 主要 研究 了 两 个 结果 : 报告 的 投票 行为 和 实际 的 投票 
行为 。 首 先 ， 他 们 发 现 ， 信 息 + 社交 组 的 人 点 击 “ 我 已 投票 ”的 概率 比 信息 
组 的 人 高 了 约 2 个 百分点 ( 约 20% : 18% ) 。 其 次 ， 研 究 人 员 将 他 们 所 搜 
集 的 约 600 万 名 参与 者 的 数据 与 公开 的 实际 投票 记录 对 比 后 发 现 ， 信 息 
十 社交 组 的 人 实际 投票 的 概率 比 对 照 组 的 人 高 0.39 个 百分点 ， 而 信息 组 的 
人 实际 投票 的 概率 则 与 对 照 组 的 人 相同 ( 图 4.18 ) 。 


该 实验 的 这 些 结果 表明 ， 有 些 在 线 动员 投票 的 信息 要 比 其 他 在 线 动员 投票 
的 信息 更 有 效 ， 而 且 研 究 人 员 对 该 有 效 性 的 评估 结果 还 会 不 同 ， 这 取决 于 
他 们 统计 的 是 报告 的 投票 行为 还 是 实际 的 投票 行为 。 可 惜 的 是 ， 这 项 实验 


并 没有 提供 任何 关于 社交 信息 为 什么 会 增加 投票 率 的 信息 。 可 能 是 这 些 社 
交 信 息 增 加 了 人 们 注意 到 标语 的 可 能 性 ， 或 者 是 增加 了 注意 到 这 一 标语 的 
人 实际 投票 的 可 能 性 ， 或 者 是 两 个 原因 都 有 。 因 此 ， 这 项 实验 提供 了 一 个 
有 趣 的 发 现 ， 更 多 的 研究 人 员 可 能 会 对 其 进行 探究 (参阅 例如 Bakshy， 
Eckles, et al. 2012 ) 。 


除了 推进 研究 人 员 的 目标 以 外 ， 这 项 研究 还 推进 了 合作 组 织 ( 脸谱 网 ) 的 
目标 。 如 果 将 研究 的 行为 由 投票 换 成 购买 肥皂 ， 你 就 会 发 现 ， 这 项 研究 的 
结构 与 衡量 在 线 广告 效果 的 实验 结构 是 完全 相同 的 ( 可 参阅 例如 Lewis 
and Rao 2015 ) 。 这 些 针 对 广告 效果 的 研究 经 常会 衡量 接触 在 线 广告 对 线 
下 行为 的 影响 。 因 此 ， 这 项 研究 可 以 提高 脸谱 网 研究 在 线 广告 效果 的 能 
力 ， 同 时 有 助 于 脸谱 网 让 潜在 的 广告 商 相信 脸谱 网 上 的 广告 在 改变 行为 方 
面 是 有 效 的 。 


在 这 项 研究 中 ， 尽 管 研 究 人 员 和 合作 组 织 想 要 了 解 的 东西 基本 一 致 ， 但 也 
存在 一 些 让 他 们 的 合作 陷入 紧张 氛围 的 分 歧 ， 尤 其 是 在 参与 者 的 分 配 上 。 
当时 实验 中 对 照 组 、 信 息 组 和 信息 + 社交 组 的 人 数 分 配 是 非常 不 均衡 的 。 
对 研究 人 员 来 说 ， 这 样 不 均衡 的 分 配 从 统计 学 角度 讲 很 低 效 ， 更 好 的 分 配 
方式 是 每 组 有 1/3 的 参与 者 。 但 之 所 以 当时 采取 这 一 分 配方 式 ， 是 因为 脸 
谱 网 想 让 每 个 人 都 接收 信息 + 社交 处 理 。 幸 运 的 是 ， 研 究 人 员 说 服 脸谱 网 
为 信息 组 和 对 照 组 各 保留 1% 的 参与 者 。 如 果 没 有 对 照 组 ， 衡 量 信息 十 社 
交 的 处 理 效应 就 基本 不 可 能 了 ， 因 为 这 将 是 一 个 “干扰 观察 ”实验 ， 而 不 是 
随机 对 照 实验 。 这 项 研究 为 与 有 能 力 的 组 织 合作 开展 实验 提供 了 宝贵 的 实 
践 经 验 : 同样 是 促成 一 项 实验 ， 有 时 你 需要 说 服 一 个 组 织 去 实施 一 项 处 
理 ， 而 有 时 则 需要 说 服 一 个 组 织 不 去 实施 一 项 处 理 ( 即 要 求 设置 一 个 对 照 
组 ) ° 


合作 并 不 总 是 要 找 科 技 公司 ， 也 并 不 总 是 要 开展 有 数 百 万 参与 者 的 A/B 测 
试 。 例 如 ， 亚 历 山大 . 科 波 克 (Alexander Coppock ) 、 安 德 鲁 . 格 斯 
(Andrew Guess ) 和 约翰 , 捷 尔 诺 夫 斯 基 (John Ternovski ) 就 在 2016 年 
与 非 政 府 环保 组 织 保育 选民 联盟 (League of Conservation Voters ) 针对 
不 同 策略 在 促进 社会 动员 方面 的 有 效 性 合作 开展 了 实验 。 研 究 人 员 利 用 该 
非 政府 组 织 的 推 特 账号 发 送 了 公众 推 文 和 直接 面向 个 人 的 、 试 图 侧重 于 不 
同类 型 身份 信息 的 消息 ， 然 后 测量 了 这 些 消息 中 哪些 消息 在 动员 人 们 签署 
请 愿 书 和 转发 有 关 请 愿 书 的 内 容 方 面 最 为 有 效 。 


总 的 来 说 ， 与 有 能 力 的 组 织 合作 所 能 达到 的 实验 规模 是 个 人 难以 达到 的 , 
表 4.3 列 出 了 研究 人 员 与 组 织 合作 开展 的 其 他 实验 实例 。 此 外 ， 合 作 开 展 

实验 要 比 创 建 自己 的 实验 简单 很 多 。 但 合作 开展 实验 也 存在 缺点 : 合作 会 
限制 参与 者 、 处 理 及 你 所 能 研究 的 结果 的 类 型 ， 而 且 还 可 能 引发 道德 伦理 
方面 的 问题 。 发 现 合作 实验 的 最 好 方法 是 注意 到 那些 能 通过 有 趣 的 科学 研 


a 


究 来 解决 的 实际 问题 。 如 果 你 还 不 习惯 用 这 样 的 方式 去 观察 这 个 世界 ， 那 
an 


长 。 


么 就 很 难 发 现 属于 巴 斯 德 象限 内 的 实验 ， 但 通过 练习 ， 你 会 变 得 越 来 越 擅 


表 4.3 研究 人 员 和 组 织 合作 开展 的 研究 实例 


研究 主题 


参考 文献 


脸谱 网 信息 流 对 信息 分 享 的 影响 


部 分 匿名 对 在 线 交 友 网 站 上 行为 的 影响 


Bakshy, Rosenn, et al. (2012 ) 


Bapna et al. (2016 ) 


家 庭 能 源 报告 对 用 电量 的 影响 


应 用 程序 设计 对 病毒 传播 的 影响 


Allcott (2011, 2015 ) ; Allcott and Rogers 
(2014) ; Costa and Kahn ( 2013 ) ; Ayres, 
Raseman, and Shih ( 2013 ) 


Aral andWalker ( 2011 ) 


传播 机 制 对 传播 的 影响 


广告 中 社交 信息 的 影响 


产品 目录 更 新 频率 对 通过 产品 目录 购买 或 
在 线 购买 的 不 同 客户 购买 量 的 影响 


受 欢 迎 的 信息 对 潜在 求职 者 的 影响 


初始 评价 对 受 欢迎 程度 的 影响 


Taylor, Bakshy, and Aral ( 2013 ) 


Bakshy, Eckles, et al. (2012 ) 


Simester et al. ( 2009 ) 


Muchnik, Aral, and Taylor ( 2013 ) 


消息 内 容 对 政治 动员 的 影响 


== 
> ‘ 
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Coppock, Guess, and Ternovski ( 2016 ) 


有 些 实验 的 研究 人 员 为 合作 组 织 的 员工 。 


4.6 建议 


无 论 你 是 自行 开展 实验 还 是 与 相关 组 织 合作 开展 ， 我 都 想 分 享 我 在 工作 中 
发 现 的 特别 有 用 的 四 条 建议 ， 其 中 前 两 条 适用 于 任何 实验 ， 后 两 条 则 主要 
针对 数字 时 代 的 实验 。 


当 你 要 开展 一 项 研究 时 ， 我 的 第 一 条 建议 是 ， 在 搜集 数据 前 应 尽 可 能 多 地 
思考 。 对 习惯 于 开展 实验 的 研究 人 员 来 说 ， 这 似乎 是 显而易见 的 ， 但 对 习 
惯 于 利用 大 数据 资源 的 研究 人 员 来 说 ， 这 是 非常 值得 注意 的 〈 参见 第 2 

章 ) 。 利 用 大 数据 资源 时 ， 大 多 数 工作 需要 在 搜集 到 数据 后 才能 完成 ， 但 
开展 实验 是 相反 的 ， 大 多 数 的 工作 应 该 在 数据 采集 前 完成 。 迫 使 你 自己 在 
搜集 数据 前 仔细 思考 的 最 好 的 方法 之 一 是 为 你 的 研究 创建 一 个 预 分 析 计 
划 ， 基 本 描述 一 下 你 将 进行 的 分 析 。 


我 的 第 二 条 适用 于 所 有 实验 的 建议 是 ， 没 有 一 个 单一 的 实验 是 完美 的 ， 
此 ， 你 应 该 考虑 设计 一 系列 相辅相成 的 实验 。 有 人 将 这 一 策略 称 为 无 敌 舰 
队 策略 。 也 就 是 说 ， 与 其 努力 打造 一 艘 庞大 的 战舰 ， 不 如 建造 许多 优势 互 
补 的 小 型 战舰 。 这 类 多 实验 研究 在 心理 学 领域 是 很 常见 的 ， 在 其 他 领域 却 
很 少见 。 幸 运 的 是 ， 有 些 数字 实验 的 低 成 本 使 多 实验 研究 变 得 更 加 容易 
Ts 


分 享 完 以 上 两 条 适用 于 所 有 实验 的 建议 后 ， 接 下 来 我 将 分 享 两 条 主要 针对 
数字 时 代 实验 设计 的 建议 : 创造 零 可 变 成 本 数据 和 将 道德 伦理 融入 设计 
中 。 


4.6.1 创造 零 可 变 成 本 数据 


开展 大 型 实验 的 关键 是 将 你 的 可 变 成 本 降低 到 零 。 实 现 这 一 点 最 好 的 方法 
是 自动 化 和 设计 有 趣 的 实验 。 


数字 实验 可 以 有 截然 不 同 的 成 本 结构 ， 这 也 使 得 研究 人 员 能 够 开展 过 去 不 
可 能 开展 的 实验 。 考 虑 这 一 差异 的 一 种 方式 是 从 国定 成 本 和 可 变 成 本 ( 实 
验 成 本 通常 被 分 为 这 两 类 ) 入 手 。 固 定 成 本 是 指 不 会 随 参与 者 数量 的 变化 
而 变化 的 成 本 。 例 如 ， 在 一 项 实验 室 实 验 中 ,固定 成 本 可 能 就 是 租用 场地 
和 购买 设备 所 产生 的 成 本 。 而 可 变 成 本 则 是 指 会 随 参 与 者 数量 的 变化 而 变 
化 的 成 本 。 例 如 ， 在 一 项 实验 室 实验 中 ， 可 变 成 本 可 能 来 自给 研究 助理 和 
参与 者 的 经 济 报酬 。 一 般 来 说 ， 模 拟 实验 是 固定 成 本 较 低 ， 可 变 成 本 较 

高 ， 而 数字 实验 则 是 固定 成 本 较 高 ， 可 变 成 本 较 低 (图 4.19 ) 。 尽 管 数字 
实验 的 可 变 成 本 较 低 ， 但 如 果 你 愿意 尝试 将 其 降低 到 零 ， 就 可 以 创造 出 许 


多 令 人 兴奋 的 机 会 。 


模拟 实验 


成 本 


gx. bas HY I. 
参与 者 数量 


图 4.19 模拟 实验 和 数字 实验 的 成 本 结构 示意 图 。 一 般 来 说 ， 模 拟 实验 是 
固定 成 本 较 低 ， 可 变 成 本 较 高 ， 而 数字 实验 则 是 固定 成 本 较 高 ， 可 变 成 本 
较 低 。 不 同 的 成 本 结构 意味 着 数字 实验 能 达到 模拟 实验 不 可 能 达到 的 规 
模 。 


实验 的 可 变 成 本 主要 产生 于 两 个 方面 ， 即 给 研究 助理 的 经 济 报酬 和 给 参与 
者 的 经 济 报酬 ， 我 们 可 通过 不 同 的 策略 将 这 两 方面 的 成 本 降低 到 零 。 给 研 
究 助 理 经 济 报酬 是 因为 需要 他 们 去 招募 参与 者 、 实 施 处 理 以 及 测量 结果 。 
例如 ， 舒 尔 英和 同事 针对 用 电量 的 模拟 实地 实验 就 需要 研究 助理 前 往 每 个 
家 庭 实 施 处 理 并 记录 电表 读数 。 这 就 意味 着 增加 参与 研究 的 家 庭 就 会 增加 
成 本 。 而 在 雷 斯 蒂 沃 和 范 德 里 杰 特 针对 奖励 与 人 们 编辑 维基 百科 贡献 的 天 
系 而 开展 的 数字 实地 实验 中 ， 增 加 参与 者 几乎 不 会 增加 任何 成 本 。 降 低 可 
变 行政 成 本 的 一 般 策 略 是 用 计算 机 ( 便宜 的 ) 来 代替 人 工 〈 昂贵 的 ) 工 
作 。 粗 略 地 说 ， 你 可 以 问 自己 : 当 我 的 研究 团队 中 的 每 个 人 都 在 睡觉 时 ， 
这 个 实验 还 能 运转 吗 ” 如 果 答 案 是 肯定 的 ， 那 么 你 的 实验 在 自动 化 方面 是 
很 出 众 的 。 


实验 的 可 变 成 本 还 源 于 给 参与 者 的 经 济 报酬 。 一 些 研究 人 员 会 通过 使 用 机 
器 人 MTurk 和 其 他 在 线 劳 动力 市 场 来 减少 需 支 付 给 参与 者 的 经 济 报酬 。 但 


要 想 将 可 变 成 本 降低 到 零 ， 则 需要 采取 一 种 不 同 的 方法 。 很 长 一 段 时 间 以 
来 ， 研 究 人 员 设 计 的 实验 都 是 很 枯燥 的 ， 所 以 必须 花 钱 才能 让 人 参与 。 但 
如 果 你 能 设计 一 个 人 们 自愿 想 参 与 的 实验 呢 ? 这 听 起 来 可 能 有 点 令 人 难以 
置信 ， 但 我 自己 就 曾 开 展 过 这 样 一 个 实验 ， 我 将 在 后 文中 对 其 进行 描述 ， 
表 4.4 还 列 出 了 其 他 这 类 型 实验 的 例子 。 需 要 注意 的 是 ， 设 计 有 趣 的 实验 
这 一 想法 与 第 3 章 中 天 于 设计 更 有 趣 的 调查 和 第 5 章 中 关于 大 规模 协作 设计 
的 一 些 主题 相 呼 应 。 因 此 ， 我 认为 参与 者 的 喜爱 度 ， 也 可 能 被 称 为 用 户 体 
验 ， 将 是 数字 时 代 研 究 设计 中 越 来 越 重要 的 一 部 分 。 


表 4.4 零 可 变 成 本 的 实验 实例 
用 有 价值 的 服务 或 愉快 的 体验 作为 对 参与 者 的 酬谢 


酬谢 方式 参考 文献 


健康 信息 网 站 Centola( 2010 ) 


锻炼 计划 Centola( 2011 ) 


Salganik, Dodds, and Watts( 2006 ) ; 


免费 音乐 
Salganik and Watts ( 2008, 2009b ) 


有 趣 的 游戏 Kohli et al.( 2012 ) 


电影 推荐 Harper and Konstan( 2015 ) 


如 果 你 想 创 造 零 可 变 成 本 的 实验 ， 就 需要 确保 一 切 都 是 全 自动 化 的 ， 而 且 
参与 者 也 不 需要 任何 经 济 报酬 。 我 将 通过 我 针对 文化 产品 的 成 功 和 失败 的 
论文 研究 来 说 明 如 何 实现 这 一 点 。 


我 的 论文 最 初 是 想 探究 那些 令 人 费解 的 文化 产品 的 成 功 。 热 门 歌 曲 、 畅 销 
书 和 卖座 的 电影 ， 其 人 气 指数 比 各 自 领 域 的 平均 水 平 要 高 得 多 。 也 正 因 如 
此 ， 这 些 产 品 的 市 场 通常 被 称 为 赢家 通 吃 的 市 场 。 与 此 同时 ， 究 竟 哪 首 
歌 、 哪 本 书 或 哪 部 电影 会 成 功 ， 却 是 非常 难 预测 的 。 编 剧 威廉 . 戈 德 曼 
(William Goldman ) 曾 对 大 量 学 术 研 究 做 出 了 如 下 的 高 度 概括 :“ 当 预测 
成 功 时 ， 没 有 人 知道 任何 事 。” 赢 家 通 吃 的 市 场 的 不 可 预测 性 让 我 很 想 知 
道 文化 产品 的 成 功 多 大 程度 是 因为 质量 ， 多 大 程度 是 因为 运气 。 或 者 ， 稍 
微 换 种 方式 表达 就 是 ， 如 果 我 们 可 以 创造 出 平行 世界 并 让 它们 独立 运转 ， 
那么 同样 的 歌曲 在 这 些 世界 中 也 会 受 欢迎 吗 ? 如 果 不 会 ， 造 成 这 些 差异 的 
机 制 又 是 什么 呢 ? 


为 了 回答 这 些 问题 ， 我 和 我 的 论文 导师 彼得 :多 兹 ( Peter Dodds ) 、 邓 肯 : 
瓦 菊 开展 了 一 系列 在 线 实地 实验 。 具 体 来 说 ， 我 们 创建 了 一 个 叫 音乐 实验 
室 (MusicLab ) 的 网 站 ， 人 们 可 以 通过 该 网 站 发 现 新 的 音乐 ， 然 后 我 们 利 


用 这 一 网 站 进行 了 一 系列 实验 。 我 们 通过 在 青少年 喜欢 的 一 个 网 站 上 发 布 
横幅 广告 ( 图 4.20 ) 以 及 媒体 广播 来 招募 参与 者 。 进 入 网 站 的 参与 者 需 先 
签署 知情 同意 书 ， 然 后 完成 一 项 简短 的 背景 问卷 ， 之 后 会 被 随机 分 入 对 照 
组 或 实验 组 。 在 对 照 组 中 ， 参 与 者 根据 给 出 的 乐队 名 和 歌 名 自行 决定 要 听 
哪 首 歌 。 他 们 在 听 歌 的 同时 会 被 要 求 对 歌曲 进行 评分 ， 之 后 便 可 以 下 载 这 
Bak (也 可 以 不 下 载 ) 。 实 验 组 的 流程 也 是 一 样 的 ， 唯 一 的 不 同 是 参与 者 
还 可 以 看 到 每 首 歌 被 前 面 的 参与 者 下 载 的 次 数 。 此 外 ， 实 验 组 的 参与 者 还 
会 被 随机 分 配 到 8 个 所 谓 的 平行 世界 中 ， 每 个 平行 世界 都 是 独立 运转 的 
(图 4.21 ) 。 利 用 这 一 设计 ， 我 们 开展 了 两 个 相关 的 实验 。 在 第 一 个 实验 
中 ， 我 们 未 对 呈现 给 参与 者 的 表格 中 的 歌曲 进行 排序 ， 歌 曲 的 受 欢迎 程度 
不 是 很 直观 。 在 第 二 个 实验 中 ， 我 们 对 呈现 给 参与 者 的 歌曲 进行 了 排序 ， 
歌曲 的 受 欢 迎 程度 更 加 直观 ( 图 4.22 ) 。 


me 次 评分 ”次 FR Kk ”音乐 实验 室 


图 4.20 我 和 同事 用 来 为 音乐 实验 室 实验 招募 参与 者 的 横幅 广告 示例 
(Salganik, Dodds, and Watts 2006 ) 。 经 允许 复制 自 
Salganik (2007) ， 图 2.12。 


[image] 
图 4.21 音乐 实验 室 的 实验 设计 。 参 与 者 被 随机 分 入 对 照 组 或 实验 组 。 对 
照 组 的 参与 者 需 在 完全 不 知道 其 他 参与 者 的 选择 的 情况 下 做 出 选择 。 MS 


验 组 的 参与 者 则 被 随机 分 配 到 8 个 平行 世界 ， 并 能 看 到 每 首 歌 在 其 所 在 世 
界 中 的 受 欢 迎 程度 ( 根据 前 面 的 参与 者 的 下 载 次 数 来 衡量 ) ， 但 他 们 不 会 
看 到 有 关 其 他 世界 的 任何 信息 ， 他 们 甚至 都 不 知道 其 他 世界 的 存在 。 改编 
自 Salganik, Dodds, and Watts (2006) ， 图 s1。 


图 4.22 音乐 实验 室 实验 不 同 处 理 的 屏幕 截图 。 在 实验 1 的 实验 组 中 ， 研 究 


人 员 将 歌曲 及 其 之 前 被 下 载 的 次 数 通过 一 个 16 x 3 的 矩形 表格 呈现 给 参与 
者 ， 其 中 每 个 参与 者 所 看 到 的 歌曲 顺序 都 是 随机 分 配 的 。 在 实验 2 的 实验 
组 中 ， 研 究 人 员 将 歌曲 及 其 之 前 被 下 载 的 次 数 按 当前 受 欢迎 程度 降序 排列 
呈现 给 参与 者 。 经 允许 复制 自 Salganik (2007) ， 图 2.7 和 图 2.8。 


我 们 发 现 每 首 歌 在 不 同 世界 的 受 欢 迎 程度 是 不 同 的 ， 这 表明 运气 在 歌曲 的 
成 功 中 起 了 重要 的 作用 。 例 如 ， 同样 是 一 个 乐队 的 一 首 歌 ， 在 一 个 世界 中 
它 是 48 首 歌 中 最 受 欢 迎 的 ， 在 另 一 个 世界 中 却 排 在 了 第 40 位 。 同 样 的 一 首 
歌 与 相同 的 另外 47 首 歌 竞争 ， 在 一 个 世界 中 它 幸 运 地 成 了 最 流行 的 歌曲 ， 

在 其 他 世界 却 没 有 。 此 外 ， 通 过 比较 两 个 实验 的 结果 ， 我们 发 现实 验 处 理 
增加 了 这 些 市 场 赢 家 通 吃 的 性 质 ， 这 也 许 说 明了 技巧 的 重要 性 。 但 纵 观 所 
有 平行 世界 后 ( 只 有 这 种 设置 平行 世界 的 实验 才能 做 到 这 一 点 ) ， 我 们 发 
现实 验 处 理 实际 上 增加 了 运气 的 重要 性 。 而 且 令 人 惊讶 的 是 ， 越 具 吸 引力 

的 歌曲 ， 运气 对 其 成 功 越 重要 ( 图 4.23 ) 。 


音乐 实验 室 实验 的 设计 方式 使 其 基本 上 能 够 以 零 可 变 成 本 进行 。 首 先 ， 一 
切 都 是 全 自动 化 的 ， 所 以 在 我 睡觉 时 它 依旧 可 以 进行 。 其 次 ， 给 参与 者 的 
酬劳 是 免费 的 音乐 ， 所 以 不 会 产生 可 变 的 参与 者 报酬 成 本 。 利 用 音乐 作为 
酬 芳 也 说 明了 有 时 需要 在 固定 成 本 和 可 变 成 本 之 间 进 行 权 衡 取 舍 。 利 用 音 
乐 做 实验 增加 了 实验 的 固定 成 本 ， 因 为 我 必须 花 时 间 从 乐队 那里 获得 音乐 
的 使 用 权 ， 并 为 他 们 准备 有 关 参 与 者 对 其 音乐 的 反响 的 报告 。 但 就 音乐 实 
验 室 实验 来 说 ， 增 加 固定 成 本 、 减 少 可 变 成 本 是 正确 的 做 法 ， 因 为 这 使 得 
我 们 能 够 开展 在 规模 上 约 比 标准 实验 室 实验 大 100 倍 的 实验 。 


实验 1 实验 2 


0.20 + 
= e 
Æ 0.15 a 
= 0.10 . 
ST e 
& . 8 
ty CLR 
ae f 6 3 e e . * ; 
5 0.05 es > Je; 。 oe teste 
三 P oS SY ue : 
payee” mi: LE 
= : Py $ e 
© ooo] it | jing 


- 


T T T T 
0.00 0.01 0.02 0.03 0.04 0.05 0.00 0.01 0.02 003 0.04 0.05 
对 照 组 中 歌曲 的 市 场 份额 对 照 组 中 歌曲 的 市 场 份额 


214.23 表明 吸引 力 和 成 功 之 间 的 关系 的 音乐 实验 室 实 验 结果 。 其 中 x 轴 是 
对 照 组 中 歌曲 的 市 场 份 额 ， 作 为 对 歌曲 吸引 力 的 一 种 衡量 。y 轴 是 8 个 平行 
世界 的 实验 组 中 相同 歌曲 的 市 场 份额 ， 作 为 对 歌曲 成 功 的 一 种 衡量 。 我 们 
发 现 ， 增 强 实 验 处 理 的 力度 ， 特 别 是 将 歌曲 布局 从 实验 1 的 方式 换 成 实验 2 
的 方式 ( 图 4.22 ) ， 会 让 成 功 变 得 更 加 不 可 预测 ， 尤 其 是 对 那些 最 具 吸 引 
力 的 歌曲 来 说 。 改编 自 Salganik, Dodds, and Watts (2006) ， 图 3。 


此 外 ， 音 乐 实验 室 实验 表明 ， 零 可 变 成 本 本 身 并 不 一 定 就 是 最 终 的 目标 ， 
它 还 可 以 是 开展 一 种 新 型 实验 的 方式 。 需 要 注意 的 是 ， 尽 管 我 们 拥有 的 参 
与 者 数量 大 约 是 标准 实验 室 实验 参与 者 数量 的 100 倍 ， 但 我 们 并 没有 利用 
所 有 的 参与 者 来 开展 100 次 研究 实验 处 理 效应 的 标准 实验 室 实验 。 相 上 反 ， 
我 们 做 了 一 些 不 同 的 事情 ， 你 可 以 将 其 看 作 从 心理 学 实验 到 社会 学 实验 的 
转变 (Hedstrom 2006 ) 。 我 们 在 实验 中 关注 的 是 受 欢迎 程度 ， 这 是 一 个 
总 体 结果 ， 而 不 是 个 体 决 定 。 将 关注 点 转移 到 总 体 结果 上 意味 着 我 们 需要 
大 约 700 名 参与 者 来 得 出 一 个 单一 的 数据 点 ( 每 个 平行 世界 中 有 700 名 参 
与 者 ) 。 这 一 实验 规模 正 是 因为 我 们 的 成 本 结构 才 成 为 可 能 。 总 的 来 说 ， 
如 果 研 究 人 员 想 要 研究 个 体 决定 是 如 何 产 生 总 体 结果 的 ， 那 么 音乐 实验 室 
实验 这 样 的 分 组 实验 是 非常 令 人 振奋 的 选择 。 在 过 去 ， 这 类 实验 面临 着 组 
织 实 施 上 的 困难 ， 但 因为 零 可 变 成 本 数据 成 为 可 能 ， 这 些 困难 也 正在 逐渐 
消失 。 


除了 说 明 零 可 变 成 本 数据 的 好 处 之 外 ， 音 乐 实 验 室 实验 还 表明 了 这 种 方法 
面临 的 一 个 挑战 ， 即 高 固定 成 本 。 就 我 的 事例 而 言 ， 我 非常 幸运 地 遇 到 了 
一 位 名 叫 彼得 . 豪 塞 尔 ( Peter Hausel ) 的 出 色 的 网 站 开发 人 员 ， 然 后 我 们 

花 了 大 约 6 个 月 一 起 构建 了 上 述 实 验 。 也 是 因为 我 的 导师 邓肯 - 瓦 滨 获得 了 

一 些 支 持 该 类 研究 的 资助 款项 ， 它 才 得 以 实现 。 我 们 创建 音乐 实验 室 是 在 
2004 年 ， 现 在 的 技术 已 经 进步 了 ， 所 以 现在 构建 这 样 的 实验 应 该 是 更 加 容 
易 了 。 但 高 固定 成 本 策略 确实 是 只 有 那些 能 够 承担 得 起 成 本 的 研究 人 员 才 
能 采用 的 。 


综 上 所 述 ， 数 字 实验 具有 与 模拟 实验 截然 不 同 的 成 本 结构 。 如 果 你 想 开 展 
大 规模 的 实验 ， 就 应 该 尝试 尽 可 能 降低 可 变 成 本 ， 最 好 能 降低 到 零 。 你 可 
以 通过 使 实验 过 程 自 动 化 ( 例如 让 计算 机 代替 人 工 ) 和 设计 人 们 自愿 想 要 
参与 的 实验 来 做 到 这 一 点 。 能 够 设计 出 具有 这 些 特征 的 实验 的 研究 人 员 , 
便 能 开展 过 去 不 可 能 实现 的 新 型 实验 。 但 开展 零 可 变 成 本 实验 也 会 引发 新 
的 道德 伦理 问题 ， 这 也 是 我 接 下 来 将 探讨 的 主题 。 


4.6.2 将 道德 伦理 融入 你 的 设计 : 替代 、 改 进 和 减少 
你 可 以 通过 用 非 实 验 研究 替代 实验 、 改 进 处 理 和 减少 参与 者 的 数量 ， 使 实 


验 更 加 人 道 。 


针对 数字 实验 设计 的 第 二 条 建议 是 关于 道德 伦理 的 。 正 如 雷 斯 蒂 沃 和 范 德 
里 杰 特 针对 维基 百科 谷 仓 之 星 的 实验 所 示 ， 降 低 成 本 意味 着 道德 伦理 将 成 
为 研究 设计 中 越 来 越 重 要 的 一 部 分 。 除 了 我 在 第 6 章 将 描述 的 用 来 指导 人 
体 实验 的 伦理 框架 之 外 ， 设 计数 字 实验 的 研究 人 员 还 可 以 参考 另 一 个 来 源 
的 道德 伦理 理念 : 指导 动物 实验 的 伦理 原则 。 尤 其 是 罗素 ( Russell ) 和 伯 
@ (Burch) 在 其 具有 里 程 碑 意义 的 《人 道 实验 技术 原则 》 (Principles of 
Humane Experimental Technique ) 一 书 中 提出 的 指导 动物 实验 的 三 个 原 

则 : 替代 、 改 进 和 减少 。 我 认为 ， 这 三 个 原则 稍 做 修改 后 也 可 以 被 用 来 指 
导 人 体 实验 的 设计 。 


-替代 : 如 果 可 能 的 话 ， 用 侵害 性 更 小 的 方法 来 替代 实验 。 
:改进 : 改进 处 理 ， 使 其 尽 可 能 不 具 危 害 性 。 
减少 : 尽 可 能 减少 实验 的 参与 者 。 


我 首先 将 通过 一 个 引发 伦理 争议 的 在 线 实 地 实验 来 更 具体 地 阐明 这 三 个 原 
则 ， 并 向 大 家 展示 它们 是 如 何 造就 更 好 、 更 人 道 的 实验 设计 的 。 然 后 ， 我 
将 描述 这 三 个 原则 如 何 让 实验 设计 人 员 想 到 具体 实用 的 优化 方案 。 


最 具 伦 理 争 议 的 数字 实地 实验 之 一 是 亚当 : 克 雷 默 (Adam Kramer ) 、 杰 米 
: 吉 约 里 (Jamie Guillory ) MNHE NE (Jeffrey Hancock ) 开展 的 一 
项 被 称 为 “情绪 感染 ”的 实验 。 实 验 是 在 脸谱 网 上 进行 的 ， 出 发 点 是 为 了 解 
决 一 些 科学 和 实际 问题 。 当 时 ， 脸 谱 网 用 户 与 脸谱 网 互动 的 主要 方式 是 信 
息 流 ， 即 通过 算法 控制 的 来 自 脸 谱 网 用 户 好 友 的 状态 更 新 。 一 些 批评 脸谱 
网 的 人 认为 ， 因 为 信息 流 中 大 多 是 积极 的 帖子 ， 比 如 发 一 下 最 近 的 聚会 ， 
所 以 可 能 会 让 用 户 觉 得 自己 的 生活 似乎 不 如 朋友 的 精彩 ， 进 而 感到 难过 。 
但 也 可 能 恰好 相反 ， 也 许 看 到 你 的 朋友 玩 得 开心 会 让 你 也 感到 快乐 。 为 了 
验证 这 两 个 相互 矛盾 的 假设 并 进一步 了 解 一 个 人 的 情绪 如 何 被 其 朋友 的 情 
绪 所 影响 ， 克 雷 默 和 同事 开展 了 一 项 实验 。 在 这 项 为 期 一 周 的 实验 中 ， 他 
们 将 大 约 70 万 名 用 户 分 成 了 4 组 : 一 个 是 “消极 减少 ”组 ， 研 究 人 员 会 随机 
屏蔽 含有 消极 词汇 〈 例如 “难过 ”) 的 帖子 ， 以 免 其 出 现在 这 些 人 的 信息 流 
中 ; 一 个 是 “积极 减少 ”组 ， 研究 人 员 会 随机 屏 菩 含有 积极 词汇 ( 例如 “ 开 
心 ” ) 的 帖子 ， 以 免 其 出 现在 这 些 人 的 信息 流 中 ; 另外 两 组 是 对 照 组 。 

在 “消极 减少 ”组 的 对 照 组 中 ， 研 究 人 员 会 以 与 “消极 减少 ”组 相同 的 屏蔽 率 
来 随机 屏 珊 帖子 ， 但 不 会 考虑 帖子 是 消极 的 还 是 积极 的 。 在 “积极 减少 ”组 
的 对 照 组 中 ， 研 究 人 员 进 行 了 相同 的 操作 。 该 实验 设计 表明 ， 适 当 的 对 照 
组 并 不 总 是 一 个 不 对 其 进行 任何 处 理 的 组 。 也 就 是 说 ， 有 时 为 了 进行 精确 
的 比较 以 解答 所 研究 的 问题 ， 研 究 人 员 需 对 对 照 组 也 实施 一 定 的 处 理 。4 


个 组 的 用 户 可 以 通过 信息 流 以 外 的 其 他 脸谱 网 功能 看 到 被 屏蔽 的 其 好 友 的 
帖子 。 


克 雷 默 和 同事 发 现 ， 就 “积极 减少 ”组 的 参与 者 来 说 ， 他 们 更 新 状态 中 积极 
词汇 的 比例 下 降 了 ， 消极 词 汇 的 比例 则 上 升 了 。 而 就 “消极 减少 ”组 的 参与 
者 来 说 ， 他 们 更 新 状态 中 积极 词汇 的 比例 上 升 了 ， 消 极 词 汇 的 比例 则 下 降 
了 (图 4.24 ) 。 但 这 些 处 理 的 效应 量 是 很 小 的 : 实验 组 和 对 照 组 在 积极 词 
汇 和 消极 词汇 上 出 现 差异 的 概率 是 干 分 之 一 。 


消极 减少 积极 减少 


百分点 ) 


处 理 效应 ( 


消极 词汇 积极 词汇 消极 词汇 积极 词汇 


图 4.24 情绪 感染 的 证 据 。“ 消 极 减少 ”组 的 参与 者 使 用 的 消极 词汇 较 少 ， 
积极 词汇 较 多 ;“ 积 极 减 少 ” 组 的 参与 者 使 用 的 消极 词汇 较 多 ， 积 极 词汇 较 
少 。 竖 线 代表 估算 的 标准 误差 。 改 编 自 Kramer, Guillory, and 

Hancock (2014) , #11. 


在 探讨 该 实验 引发 的 道德 伦理 问题 之 前 ， 我 想 用 本 章 前 面 的 一 些 概念 来 描 


述 三 个 科学 问题 。 


首先 ， 我 们 还 不 清楚 该 实验 的 实际 细节 与 相关 理论 是 如 何 关 联 的 。 换 句 话 
说 ， 我 们 对 该 实验 的 构 念 效 度 尚 有 疑问 。 我 们 还 不 清楚 积极 词汇 和 消极 词 
汇 的 数量 是 否 能 很 好 地 反映 参与 者 的 情绪 状态 ， 因 为 我 们 不 清楚 : (1) 
人 们 在 帖子 中 使 用 的 词汇 是 否 能 很 好 地 反映 他 们 的 情绪 (2) 研究 人 员 
采用 的 特定 的 情绪 分 析 技 术 是 否 能 准确 地 推断 情绪 ( Beasley and Mason 
2015; Panger 2016 ) 。 换 句 话 说， 词汇 可 能 并 不 是 一 个 很 好 的 情绪 指 
标 ， 上 述 特定 的 情绪 分 析 技术 也 可 能 并 不 是 一 个 很 精确 的 测量 方法 。 


其 次 ， 该 实验 的 设计 和 分 析 并 没有 告诉 我 们 谁 是 受 影响 最 大 的 〈 即 没有 对 
处 理 效应 的 异 质 性 进行 分 析 ) ， 也 没有 告诉 我 们 可 能 的 原理 。 在 该 事例 
中 ， 研 究 人 员 有 很 多 关于 参与 者 的 信息 ， 但 在 分 析 实 验 时 基本 上 没有 考虑 


这 些 信息 。 


最 后 ， 该 实验 中 的 效应 量 是 很 小 的 : 实验 组 和 对 照 组 出 现 差异 的 概率 大 约 
是 干 分 之 一 。 在 他 们 的 论文 中 ， 克 雷 默 和 同事 表示 ， 这 样 的 效应 量 也 是 很 
重要 的 ， 因 为 每 天 会 有 数 以 亿 计 的 人 查看 他 们 的 信息 流 。 换 句 话说 ， 他 们 
认为 ， 即 使 对 每 个 人 的 影响 很 小 ， 但 对 数 以 亿 计 的 人 的 影响 总 和 很 大 。 就 
算 你 同意 他 们 这 个 观点 ， 这 样 的 效应 量 对 情绪 传播 这 样 一 个 更 为 普遍 的 科 
学 问题 是 否 具有 重要 意义 ， 我 们 仍然 无 从 得 知 (Prentice and Miller 
1992 ) 。 


除了 这 些 科 学 问题 ， 克 雷 默 和 同事 的 论文 在 《美国 国家 科学 院 院 刊 》 

( Proceedings of the National Academy of Sciences ) 上 发 表 后 没 几 天 就 引 
来 了 研究 人 员 和 媒体 的 强烈 抗议 ( 具体 争论 的 观点 我 将 在 第 6 章 更 详细 地 
描述 ) 。 这 场 争论 中 提出 的 问题 致使 上 述 院 刊 军 见地 就 有 关 这 项 实验 的 道 
德 伦理 问题 和 伦理 审查 过 程 的 担忧 发 表 了 社论 ( Verma 2014), 


描述 完 情绪 感染 这 一 实验 ， 现 在 我 想 说 明 的 是 ， 上 述 三 个 原则 能 为 真正 的 
研究 带 来 具体 实用 的 改进 方案 (无论 你 个 人 如 何 看 待 这 个 特定 实验 的 道德 
伦理 问题 ) 。 第 一 个 原则 是 替代 : 如 果 可 能 的 话 ， 研 究 人 员 应 该 设法 用 侵 
害 性 、 风 险 性 更 小 的 方法 来 替代 实验 。 例 如 ， 研 究 人 员 可 以 尝试 利用 自然 
实验 ， 而 不 是 开展 随机 对 照 实验 。 正 如 第 2 章 所 描述 的 ， 自 然 实验 是 指 现 
实 世 界 中 发 生 的 事情 刚好 大 致 满足 了 对 处 理 的 随机 分 配 ( 例如， 抽签 决 定 
入 伍 人 选 ) 。 自 然 实验 的 伦理 优势 在 于 ， 研 究 人 员 不 必 实 施 处 理 ， 因 为 环 
境 会 蔡 他 们 实施 。 例 如 ， 几乎 就 在 克 雷 默 等 人 开展 情绪 感染 实验 的 同一 时 
间 ， 科 维 略 ( Coviello ) 和 同事 发 现 ， 人 们 在 下 雨天 发 的 帖子 中 消极 词汇 
会 比较 多 、 积 极 词汇 会 比较 少 ， 因 此 ， 通 过 利用 天 气 的 随机 变化 ， 他 们 可 
以 在 不 进行 干预 的 情况 下 研究 信息 流 变化 的 影响 ， 这 就 好 像 是 天 气 在 替 他 


们 开展 实验 一 样 ， 他 们 的 这 一 实验 可 被 称 为 情绪 感染 自然 实验 。 他 们 的 具 
体 步骤 有 点 复杂 ， 但 我 们 现在 探讨 的 是 如 何 用 侵害 性 、 风 险 性 更 小 的 方法 
来 替代 实验 ， 所 以 他 们 的 事例 告诉 我 们 最 重要 的 一 点 是 ， 通 过 利用 自然 实 
验 ， 科 维 略 和 同事 可 以 在 不 开展 自己 的 实验 的 情况 下 了 解 情绪 传播 。 


第 二 个 原则 是 改进 : 研究 人 员 应 该 设法 改进 实验 处 理 ， 以 使 其 尽 可 能 

害 。 例 如 ， 研究 人 员 可 以 增加 积极 或 消极 的 内 容 ， 而 不 是 屏蔽 积极 或 消极 
的 内 容 。 增 加 内 容 的 设计 会 改变 参与 者 信息 流 的 情绪 内 容 ， 但 也 能 解决 批 
评 者 提出 的 一 个 顾虑 ， 即 实验 可 能 导致 参与 者 错过 信息 流 中 的 重要 信息 。 
在 克 雷 默 和 同事 的 设计 中 ， 重 要 信息 与 不 重要 信息 被 屏蔽 的 概率 是 一 样 
的 。 但 在 增加 内 容 的 设计 中 ， 被 取代 的 将 会 是 那些 不 太 重 要 的 信息 。 


第 三 个 原则 是 减少 : 研究 人 员 应 该 设法 将 实验 参与 者 的 数量 减少 到 完成 科 
学 目标 所 需要 的 最 小 数目 。 在 模拟 实验 中 ， 因 为 参与 者 的 可 变 成 本 较 高 ， 
所 以 研究 人 员 自 然 会 这 么 做 。 但 在 数字 实验 中 ， 尤 其 是 零 可 变 成 本 的 实验 
中 ， 研 究 人 员 不 会 因为 实验 的 规模 而 面临 成 本 问题 ， 这 就 有 可 能 导致 不 必 
要 的 大 规模 实验 。 


例如 ， 克 雷 默 和 同事 就 应 该 利用 有 天 参 与 者 的 处 理 前 信息 ， 比 如 处 理 前 的 
发 帖 行为 ， 来 使 他 们 的 分 析 更 加 高 效 。 更 具体 地 说 ， 克 雷 默 和 同事 应 该 比 


较 实验 组 中 积极 词汇 的 比例 变化 和 对 照 组 中 积极 词汇 的 比例 变化 ， 而 不 是 
比较 实验 组 的 积极 词汇 比例 和 对 照 组 的 积极 词汇 比例 。 前 者 有 时 被 称 为 混 
合 设计 ( 图 4.5 ) ， 有 时 也 被 称 为 双重 差分 估计 量 法 。 也 就 是 说 ， 研 究 人 

员 应 该 计算 出 每 个 参与 者 的 变化 量 ( 处 理 后 行为 一 处 理 前 行为 》， 然后 比 


较 实验 组 和 对 照 组 参与 者 的 变化 量 。 这 种 双重 差分 的 方法 从 统计 学 角度 来 
讲 会 更 加 高 效 ， 因 为 它 意味 着 研究 人 员 可 以 利用 更 小 的 样本 量 实现 相同 的 
置信 和 度 。 


就 克 雷 默 和 同事 的 实验 而 言 ， 因 为 没有 原始 数据 ， 所 以 我 们 很 难 确切 地 知 
道 双重 差分 估计 量 法 的 效率 比 原 来 方法 的 效率 具体 高 出 了 多 少 ， 但 可 以 通 
过 其 他 相 天 的 实验 获得 一 个 大 致 的 概念 。 邓 (Deng) 等 人 报告 称 ， 通 过 采 
用 其 中 一 种 双重 差分 估计 量 法 ， 他 们 将 三 个 不 同 在 线 实验 的 估计 量 的 方差 
减少 了 约 50%。 谢 (Xie) 和 奥 里 塞 (Aurisset ) 也 报告 了 类 似 的 结果 。 
50% 的 方差 缩减 意味 着 如 果 克 雷 默 和 同事 采用 一 种 稍微 不 同 的 分 析 方 法 ， 
那么 他 们 所 需 的 样本 量 可 能 就 能 减少 一 半 。 换 句 话说 ， 稍 微 改变 一 下 分 析 
方法 或 许 就 能 减少 35 万 名 参与 者 了 。 


在 这 一 点 上 ， 你 可 能 会 想 研究 人 员 为 什么 要 在 意 这 35 万 人 在 情绪 感染 实验 
中 是 否 多 余 呢 ? 这 是 因为 情绪 感染 实验 的 两 个 特性 使 我 们 有 必要 担忧 实验 
规模 过 大 ， 许 多 数字 实地 实验 都 具有 这 两 个 特征 : (1) 不 确定 实验 是 否 
会 对 至 少 某 些 参与 者 产生 伤害 (2) 参与 者 不 是 自愿 参与 实验 的 。 尽 可 


能 缩小 具有 这 些 特征 的 实验 的 规模 似乎 是 合理 的 。 


要 澄清 的 一 点 是 ， 上 述 碱 小 实验 规模 的 要 求 并 不 意味 着 你 不 应 该 开展 大 规 
模 零 可 变 成 本 的 实验 。 这 只 是 意味 着 ， 实 验 规模 刚好 能 够 让 你 实现 科学 目 
标 就 可 以 了 。 确保 实验 规模 合适 的 一 个 重要 方法 是 进行 功效 分 析 (Cohen 
1988 ) 。 在 模拟 时 代 ， 研 究 人 员 通 常会 通过 功效 分 析 来 确保 他 们 的 研究 规 
模 不 会 太 小 ( 即 参与 者 过 少 ) 。 但 现在 ， 研 究 人 员 应 该 通过 功效 分 析 来 确 
保 他 们 的 研究 规模 不 会 太 大 ( 即 参与 者 过 多 ) 。 


综 上 所 述 ， 奉 代 、 改 进 和 减少 这 三 个 原则 有 助 于 研究 人 员 将 道德 伦理 融入 
实验 设计 中 。 当 然 ， 上 述 每 种 改善 情绪 感染 实验 的 方案 ， 其 本 身 也 是 瑕 瑜 
互 见 。 例 如 ， 通 过 自然 实验 得 来 的 证 据 并 不 总 是 像 通 过 随机 实验 得 来 的 那 
样 纯粹 ， 而 且 增 加 内 容 从 逻辑 上 讲 可 能 比 屏 蔽 内 容 更 难以 实现 。 因 此 ， 提 
出 这 些 改善 方案 并 不 是 为 了 事后 批评 其 他 研究 人 员 的 决定 ， 而 是 为 了 说 明 
如 何在 现实 情况 下 应 用 这 三 个 原则 。 事 实 上 ， 在 研究 设计 中 ， 权 衡 取 合 的 
问题 一 直 都 存在 ， 而 且 在 数字 时 代 ， 这 些 权 衡 将 越 来 越 涉 及 道德 伦理 方面 
的 考虑 。 稍 后 在 第 6 章 ， 我 将 给 出 一 些 有 助 于 研究 人 员 理解 和 探讨 这 些 权 
衡 取舍 的 原则 以 及 道德 伦理 框架 。 


4.7 结论 


数字 时 代 使 研究 人 员 能 够 开展 以 前 不 可 能 的 实验 。 研 究 人 员 不 仅 可 以 开展 
大 规模 的 实验 ， 还 可 以 利用 数字 实验 的 特殊 性 质 提高 效 度 ， 评 估 处 理 效应 
的 异 质 性 ， 以 及 弄 清 楚 原理 。 这 些 实 验 可 以 在 完全 数字 化 的 环境 中 进行 ， 
也 可 以 在 物理 世界 中 使 用 数字 设备 来 进行 。 


正如 本 章 所 示 ， 这 些 实验 可 以 与 有 能 力 的 公司 合作 开展 ， 也 可 完全 由 研究 
人 员 自 行 开 展 。 而 且 并 不 是 只 有 在 大 型 科技 公司 工作 的 人 才能 开展 数字 实 
验 。 如 果 要 自己 设计 实验 ， 你 可 以 尝试 将 你 的 可 变 成 本 降低 到 零 ， 并 通过 
替代 、 改 进 和 减少 这 三 个 原则 ， 将 道德 伦理 融入 设计 中 。 研 究 人 员 对 数 百 
万 人 生活 的 干预 能 力 在 不 断 增强 ， 这 就 意味 着 我 们 同样 应 该 越 来 越 关注 研 
究 设 计 是 否 符合 道德 伦理 要 求 。 能力 越 大 ， 责 任 越 大 。 


进行 大 规模 协作 


第 5 章 


5.1 简介 


维基 百科 是 不 可 思议 的 。 志 愿 者 的 大 规模 协作 创造 了 这 样 一 部 每 个 人 都 能 
使 用 的 百科 全 书 。 维 基 百 科 成 功 的 关键 不 是 新 知识 ， 而 是 新 的 协作 形式 。 
幸运 的 是 ， 数 字 时 代 使 许多 新 形式 的 协作 成 为 可 能 。 因 此 ， 我们 现在 应 该 
想 想 : 有 哪些 重大 的 科学 问题 ， 我 们 单独 无 法 解决 的 问题 ， 是 现在 通过 协 
作 能 够 解决 的 ? 


当然 ， 科 研 协作 已 经 不 是 什么 新 鲜 事 了 ， 新 鲜 的 是 数字 时 代 使 我 们 能 够 与 
数量 更 多 、 更 多 样 化 的 人 进行 协作 : 全 世界 能 够 上 网 的 数 十 亿 人 。 我 预计 
这 些 新 的 大 规模 协作 将 产生 惊人 的 结果 ， 不 仅 是 因为 它们 所 涉及 的 人 数 , 
还 因为 这 些 人 所 具有 的 多 种 多 样 的 技能 和 视角 。 我 们 如 何 才能 让 每 个 互联 
网 用 户 都 参与 我 们 的 研究 过 程 呢 ? 如 果 你 有 100 名 研究 助理 ， 你 能 做 什 

么 ? 如 果 有 10 万 名 熟练 的 协作 者 呢 ? 


现在 有 许多 种 形式 的 大 规模 协作 ， 计 算 机 科学 家 通常 会 根据 技术 特点 把 它 
们 分 成 大 量 的 类 别 ( Quinn and Bederson 2011 ) 。 然 而 在 本 章 中 ， 我 将 
根据 它们 能 如 何 被 用 于 社会 研究 来 分 类 。 有 具体 来 说 ， 我 认为 将 它们 大 致 分 
为 三 种 类 型 的 项 目 是 有 帮助 的 : 人 本 计算 、 公 开 募 集 和 分 布 式 数据 采集 
(图 5.1 ) 。 


[image] 


图 5.1 大 规模 协作 示意 图 。 本 章 将 围绕 三 种 主要 形式 的 大 规模 协作 展开 论 
述 : 人 本 计算 、 公 开 募 集 和 分 布 式 数据 采集 。 更 一 般 地 讲 ， 大 规模 协作 将 
源 于 公众 科学 、 众 包 和 集体 智慧 等 领域 的 想法 结合 了 起 来 。 


我 将 在 本 章 后 面部 分 更 详细 地 描述 每 一 类 型 的 项 目 ， 但 现在 先 让 我 简单 描 
述 一 下 每 个 类 型 。 人 本 计算 项 目 非常 适合 任务 简单 、 数 量 庞大 的 问题 ， 例 
如 给 100 万 张 图 片 贴 上 标签 。 这 类 项 目 在 过 去 可 能 是 由 作为 研究 助理 的 大 
学 生来 完成 的 。 为 这 类 项 目 做 出 贡献 不 需要 具备 与 任务 相关 的 技能 ， 并 且 
最 终 的 输出 通常 是 所 有 贡献 的 平均 值 。 人 本 计算 项 目的 一 个 经 典 示例 是 星 
系 动 物 园 (Galaxy Zoo) ， 在 这 个 项 目 中 ，10 万 名 志愿 者 协助 天 文学 家 对 
100 万 个 星系 进行 了 分 类 。 公开 募 集 项 目 则 非常 适合 为 明确 公式 化 的 问题 
寻找 新 奇 的 、 令 人 意 想 不 到 的 答案 。 这 类 问题 在 过 去 可 能 需要 请 教 同行 。 

为 这 类 项 目 做 出 贡献 需要 具备 与 任务 相关 的 专业 技能 ， 且 最 终 的 输出 通常 
是 所 有 贡献 中 最 好 的 那 一 个 方案 。 公 开幕 集 项 目的 一 个 经 典 示例 是 网 飞 

奖 ， 在 这 个 项 目 中 ， 成 干 上 万 的 科学 家 和 黑客 致力 于 开发 新 的 算法 来 预测 
用 户 对 电影 的 评价 。 最 后 ， 分 布 式 数据 采集 项 目 非常 适合 大 规模 的 数据 采 
集 。 这 类 项 目 在 过 去 可 能 是 由 作为 研究 助理 的 大 学 生 或 调查 研究 公司 来 完 


成 的 。 为 这 类 项 目 做 出 贡献 通常 能 够 接触 到 研究 人 员 无 法 接触 到 的 数据 采 
集 点 ， 且 最 终 的 产品 就 是 所 有 贡献 的 简单 合并 。 分布 式 数据 采集 项 目的 一 
个 经 典 示例 是 观 久 数据库 (eBird) ， 在 这 个 项 目 中 ， 成 二 上 万 的 志愿 者 会 
贡献 有 关 他 们 所 看 到 的 鸟 类 的 报告 。 


大 规模 协作 在 天 文学 (Marshall, Lintott, and Fletcher 2015 ) 和 生态 学 

( Dickinson, Zuckerberg, and Bonter 2010 ) 等 领域 有 着 丰富 而 悠久 的 历 
史 ， 但 在 社会 研究 中 还 不 常见 。 但 是 ， 通 过 描述 其 他 领域 的 成 功 项 目 并 提 
供 一 些 关 键 的 组 织 原 则 ， 我 希望 能 让 大 家 相信 两 件 事 。 首 先 ， 大 规模 协作 
可 以 被 用 于 社会 研究 。 其 次 ， 使 用 大 规模 协作 的 研究 人 员 将 能 够 解决 以 前 
似乎 不 可 能 解决 的 问题 。 虽 然 倡 导 大 规模 协作 的 人 经 常会 说 采用 大 规模 协 
作 能 够 省 钱 ， 但 其 实 它 的 优点 远 不 止 于 此 。 正 如 我 将 要 展示 的 ， 大 规模 协 
作 不 仅 能 让 我 们 以 更 便宜 的 方式 开展 研究 ， 还 能 让 我 们 把 研究 做 得 更 好 。 


在 本 章 之 前 的 章节 中 ， 大 家 已 经 明白 了 用 下 述 三 种 不 同 的 方式 与 人 互动 能 
了 解 到 什么 : 观察 他 们 的 行为 (第 2 章 ) 、 向 他 们 提问 (第 3 章 ) 和 招募 他 
们 来 参与 实验 ( 第 4 章 ) 。 在 本 章 中 ， 我 将 向 大 家 展示 ， 做 我 们 的 研究 协 
作者 能 了 解 到 什么 。 对 于 上 述 三 种 主要 形式 的 大 规模 协作 ， 每 一 种 我 都 将 
描述 一 个 典型 示例 ， 然 后 再 进一步 用 其 他 示例 来 曾 明 与 之 相 天 的 重要 知 
识 ， 最 后 描述 这 种 大 规模 协作 被 用 于 社会 研究 的 可 能 方式 。 本 章 最 后 将 介 
绍 5 个 有 助 于 你 设计 自己 的 大 规模 协作 项 目的 原则 。 


5.2 人 本 计算 


人 本 计算 要 解决 的 是 很 宏大 的 问题 。 我 们 需要 先 将 每 个 问题 分 解 成 多 个 简 
单 的 问题 ， 然 后 将 分 解 后 的 问题 发 布 给 志愿 者 ， 最 后 表 将 结果 整合 。 


在 人 本 计算 项 目 中 ， 每 个 人 接 到 的 都 是 简单 的 小 任务 ， 但 将 所 有 人 的 成 果 
整合 后 就 能 解决 那些 对 一 个 人 来 说 过 于 宏大 的 问题 。 如 果 曾 有 一 个 研究 问 
题 让 你 产生 了 这 样 的 想法 一 一 如 果 我 有 1000 名 研究 助理 ， 就 能 解决 这 个 问 
题 ， 那 么 这 个 问题 就 适合 用 人 本 计算 来 解决 。 


人 本 计算 项 目的 一 个 典型 示例 是 星系 动物 园 。 在 这 个 项 目 中 ， 超 过 10 万 名 
志愿 者 对 大 约 100 万 个 星系 的 图 像 进行 了 分 类 ， 而 且 其 准确 度 与 早期 对 星 
系 图 像 进行 分 类 的 专业 天 文学 家 的 准确 度 差不多 ， 但 天 文学 家 所 分 类 的 图 
像 的 数量 要 少 得 多 。 这 次 大 规模 协作 完成 了 对 更 多 图 像 的 分 类 ， 进 而 使 天 
文学 家 对 星系 是 如 何 形成 的 有 了 新 的 发 现 ， 他 们 还 发 现 了 一 个 被 称 为 “ 绿 

io” (Green Peas) 的 全 新 星系 。 


尽管 星系 动物 园 似乎 与 社会 研究 不 太 沾 边 ， 但 其 实在 很 多 情形 下 ， 社 会 研 
究 人 员 也 想 对 图 像 或 文本 进行 编码 、 分 类 或 标示 。 在 有 些 情况 下 ， 这 类 分 
析 可 以 利用 计算 机 来 完成 ， 但 有 些 形式 的 分 析 对 计算 机 来 说 很 难 ， 而 对 人 
来 说 很 简单 。 正 是 这 些 对 人 来 说 简单 、 对 计算 机 来 说 很 难 的 微 任务 ， 可 以 
通过 人 本 计算 来 完成 。 


不 仅 是 星系 动物 园 中 的 微 任务 很 具 普遍 性 ， 该 项 目的 结构 也 很 具 普遍 性 。 
星系 动物 园 以 及 其 他 人 本 计算 项 目 通常 都 采用 分 解 -运用 -整合 这 一 策略 
(Wickham 2011) ， 一 旦 你 理解 了 这 个 策略 ， 就 能 用 它 来 解决 许多 问 
题 。 首 先 ， 一 个 大 问题 会 被 分 解 成 许多 小 问题 。 然 后 ， 运 用 人 力 来 独立 解 
决 每 个 小 问题 。 最 后 ， 将 人 力 解决 的 结果 整合 ， 形 成 一 个 一 致 的 解决 方 
案 。 在 此 背景 下 ， 让 我 们 来 看 看 分 解 -运用 -整合 这 一 策略 在 星系 动物 园 中 
是 如 何 被 使 用 的 。 


5.2.1 星系 动物 园 

星系 动物 园 凝聚 众多 志愿 者 之 力 对 100 万 个 星系 进行 了 分 类 。 

星系 动物 园 是 2007 年 牛津 大 学 天 文学 研究 生 凯 文 : 肖 文 斯 基 (Kevin 
Schawinski ) 为 解决 他 所 面临 的 一 个 问题 而 想到 的 。 简 单 来 说 就 是 ， 肖 文 


斯 基 对 星系 很 感 兴趣 ， 而 人 们 可 以 根据 星系 的 形态 (椭圆 形 或 螺旋 形 ) 和 
颜色 ( 蓝 色 或 红色 ) 对 它们 进行 分 类 。 当 时 ， 天 文学 家 的 传统 观点 是 ， 像 


我 们 的 银河 系 这 样 的 螺旋 星系 的 颜色 是 蓝 色 的 〈 意味 着 年 轻 ) ， 而 椭圆 星 
系 的 颜色 则 是 红色 的 ( 意味 着 年 老 ) 。 肖 文 斯 基 对 这 一 传统 观点 有 所 怀 
疑 。 他 猜想 ， 尽 管 上 述 规律 一 般 来 讲 是 正确 的 ， 但 也 可 能 有 相当 数量 的 星 
系 例 外 ， 通 过 研究 这 些 不 符合 预期 规律 的 不 同 寻常 的 星系 ， 他 便 能 对 星系 
的 形成 过 程 有 所 了 解 。 


因此 ， 为 了 推翻 传统 观点 ， 肖 文 斯 基 需 要 的 是 大 量 按 形态 分 类 的 星系 ， 也 
就 是 已 被 划分 为 螺旋 形 或 椭圆 形 的 星系 。 但 问题 是 现 有 的 分 类 算法 还 不 足 
以 用 于 科学 研究 。 换 句 话 说， 在 当时 ， 分 类 星系 对 计算 机 来 说 是 一 项 很 难 
的 任务 。 因 此 ， 肖 文 斯 基 需 要 的 是 大 量 人 工分 类 的 星系 。 带 着 研究 生 的 热 
忱 ， 肖 文 斯 基 开 始 了 分 类 工作 。 经 过 7 天 每 天 12 小 时 的 马拉松 式 奋 战 ， 他 
共 对 5 万 个 星系 进行 了 分 类 。 尽 管 5 万 个 星系 听 起 来 可 能 很 多 ， 但 其 实 仅 占 
斯 隆 数字 天 空 勘测 计划 (Sloan Digital Sky Survey ) 所 拍摄 的 将 近 100 万 
个 星系 的 大 约 5%。 肖 文 斯 基 意 识 到 他 需要 采取 一 个 更 具 扩 展 性 的 方法 。 


幸运 的 是 ， 对 星系 进行 分 类 并 不 需要 人 们 接受 有 天 天 文学 的 高 深 培训 ， 你 
可 以 很 快 就 教会 一 个 人 如 何 进行 星系 分 类 。 换 名 话说， 尽管 星系 分 类 对 计 
算 机 来 说 是 一 项 困难 的 任务 ， 对 人 来 说 却 是 非常 简单 的 。 因 此 ， 当 肖 文 斯 
基 和 同学 克 里 斯 林 托 特 (Chris Lintott ) 坐 在 牛津 大 学 附近 的 一 家 小 酒馆 
时 ， 他 们 想到 了 创建 一 个 网 站 ， 然 后 让 志愿 者 对 星系 的 图 像 进行 分 类 。 几 
个 月 后 ， 星系 动物 园 诞生 了 。 


在 星系 动物 园 的 网 站 上 ， 志 愿 者 需 接受 几 分 钟 的 训练 。 例 如 ， 了 解 螺旋 星 
系 和 椭圆 星系 的 区 别 ( 图 5.2 ) 。 完 成 该 训练 后 ， 每 个 志愿 者 必须 通过 一 
项 相对 简单 的 考试 ， 即 正确 地 将 15 个 星系 中 的 11 个 进行 分 类 ， 然 后 就 能 开 
始 通过 一 个 简单 的 基于 网 络 的 界面 ( 图 5.3 ) 对 未 知 星系 进行 真正 的 分 类 
了 。 从 志愿 者 到 天 文学 家 的 转变 在 不 到 10 分 钟 内 就 完成 了 ， 而 且 只 需 跨越 
最 低 的 门槛 一 一 一 个 简单 的 测试 。 


椭圆 星系 螺旋 星系 


图 5.2 椭圆 星系 和 螺旋 星系 这 两 类 主要 星系 的 示例 。 星 系 动 物 园 通过 10 多 
万 名 志愿 者 对 约 100 万 张 图 像 进 行 了 分 类 。 经 允许 复制 自 GalaxyZoo.org 和 
斯 隆 数 字 天 空 勘测 计划 。 


在 一 份 报纸 报道 了 该 项 目 之 后 ， 星 系 动物 园 吸 引 来 了 第 一 批 志 愿 者 ， 然 后 
在 大 约 6 个 月 的 时 间 里 ， 项 目 吸引 了 超过 10 万 名 公民 科学 家 ， 人 们 之 所 以 

参与 是 因为 他 们 喜欢 这 项 任务 ， 并 且 想 要 帮助 推进 天 文学 的 发 展 。 这 10 万 
名 志愿 者 总 共 贡献 了 4000 多 万 条 分 类 信息 ， 其 中 大 部 分 分 类 信息 是 由 一 些 
相对 较 少 的 核心 参与 者 完成 的 ( Lintott et al. 2008 ) 。 
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图 5.3 志愿 者 被 要 求 对 单个 图 像 进行 分 类 的 输入 屏 。 根 据 斯 隆 数字 天 空 勘 
测 计 划 所 拍摄 的 一 张 图 片 ， 经 克 里 斯 林 托 特 允许 复制 而 来 。 


有 雇用 大 学 生 做 研究 助理 经 验 的 研究 人 员 可 能 会 立刻 对 数据 质量 产生 怀 
疑 。 尽 管 这 种 怀疑 是 合理 的 ， 但 星系 动物 园 这 一 项 目 表 明 ， 志 愿 者 所 贡献 
的 数据 经 正确 地 清洗 、 消 除 偏差 和 整合 后 也 能 产生 高 质量 的 结果 (Lintott 
et al. 2008 ) 。 让 公众 创造 出 专业 质量 数据 的 一 个 重要 技巧 就 是 重复 开 

展 ， 即 让 许多 不 同 的 人 来 执行 相同 的 任务 。 在 星系 动物 园 这 一 项 目 中 ， 志 
愿 者 对 每 个 星系 都 贡献 了 大 约 40 条 分 类 数据 ， 这 种 程度 的 重复 率 是 雇用 大 
学 生 做 研究 助理 的 研究 人 员 永 远 都 无 法 达到 的 ， 因 为 他 们 需要 更 加 关注 每 
个 个 体 分 类 数据 的 质量 。 志 愿 者 用 重复 弥补 了 他 们 在 训练 方面 的 欠缺 。 


尽管 不 同志 愿 者 对 同一 星系 进行 了 多 重 分 类 ， 但 要 想 把 这 些 多 重 分 类 数据 
结合 起 来 以 得 出 一 个 一 致 的 分 类 还 是 很 困难 的 。 鉴 于 大 多 数 人 本 计算 项 目 
遇 到 的 挑战 都 非常 相似 ， 所 以 简要 回顾 一 下 星系 动物 园 研究 人 员 得 出 一 致 
分 类 的 三 个 步骤 很 有 帮助 。 


首先 ， 研 究 人 员 通 过 删除 虚假 分 类 清洗 了 数据 。 例 如 ， 那些 反 复 对 同一 星 
系 进行 分 类 ( 如 果 有 人 试图 操纵 结果 可 能 就 会 这 么 做 ) 的 人 会 被 删除 所 有 
的 分 类 数据 。 这 类 清洗 及 其 他 类 似 清洗 所 删除 的 数据 约 占 总 分 类 数据 的 
4%, 


然后 ， 研 究 人 员 需 要 消除 清洗 后 的 分 类 数据 中 的 系统 偏差 。 通 过 一 系列 能 
入 在 原始 项 目 中 的 偏差 检测 研究 ， 例 如 给 一 些 志愿 者 呈现 黑白 的 而 不 是 彩 
色 的 星系 图 像 ， 研 究 人 员 发 现 了 多 个 系统 偏差 ， 例 如 把 因 距离 遥远 而 外 表 
模糊 的 螺旋 星系 划分 成 椭圆 星系 ( Bamford et al. 2009 ) 。 调 整 这 些 系统 
偏差 非常 重要 ， 因 为 重复 分 类 也 无 法 自动 消除 系统 偏差 ， 重复 分 类 只 是 有 
助 于 消除 随机 误差 。 


最 后 ， 研 究 人 员 需 要 用 一 种 方法 把 消除 偏差 后 的 个 体 分 类 数据 结合 起 来 ， 
得 出 一 个 一 致 的 分 类 。 将 每 个 星系 的 所 有 分 类 数据 结合 起 来 的 最 简单 的 方 
法 是 选择 最 常见 的 分 类 数据 。 但 这 就 意味 着 每 个 志愿 者 的 权重 是 一 样 的 ， 
而 研究 人 员 则 认为 有 些 志愿 者 要 比 其 他 志愿 者 更 擅长 分 类 。 因 此 ， 他 们 开 
发 了 一 个 更 复杂 的 迭代 加 权 程 序 ， 试 图 检测 出 最 好 的 分 类 数据 并 赋予 它们 
更 多 的 权重 。 


因此 ， 经 过 清洗 、 偏 差 消除 和 加 权 这 三 个 步骤 后 ， 星 系 动 物 园 的 研究 团队 
将 4000 万 条 志愿 者 的 分 类 数据 转化 成 了 一 组 一 致 的 形态 分 类 。 在 将 这 些 形 
态 分 类 与 之 前 三 次 由 专业 天 文学 家 进行 的 小 规模 星系 分 类 ( 其 中 包括 为 星 
系 动 物 园 的 诞生 贡献 了 部 分 灵感 的 肖 文 斯 基 所 进行 的 分 类 ) 进行 比较 后 发 
现 ， 它 们 之 间 的 吻合 度 很 高 。 因 此 ， 将 志愿 者 的 贡献 整合 后 也 能 得 出 高 质 
量 的 分 类 数据 ， 而 且 其 规模 是 研究 人 员 个 人 无 法 企及 的 ( Lintott et al. 
2008 ) 。 事 实 上 ， 通 过 对 如 此 大 量 的 星系 进行 人 工分 类 ， 肖 文 斯 基 、 林 托 
特 和 其 他 相关 人 员 发 现 ， 大 约 只 有 80% 的 星系 是 符合 预期 规律 的 ， 即 螺旋 
星系 是 赣 色 的 、 椭 圆 星 系 是 红色 的 ， 许 多 论文 都 提 及 了 这 一 发 现 (Fortson 
et al. 2011 ) 。 


至 此 ， 大 家 应 该 明白 了 星系 动物 园 是 如 何 遵循 分 解 -运用 -整合 这 一 策略 
的 ， 这 一 策略 也 被 用 于 大 多 数 人 本 计算 项 目 。 首 先 ， 把 一 个 大 问题 分 解 成 
多 个 小 问题 。 以 星系 动物 园 为 例 就 是 ， 对 100 万 个 星系 进行 分 类 这 个 大 问 
题 被 分 解 成 了 100 万 个 对 一 个 星系 进行 分 类 的 小 问题 。 然 后 ， 分 别 运用 人 
力 对 每 个 小 问题 进行 操作 。 以 星系 动物 园 为 例 就 是 ， 志 愿 者 将 每 个 星系 划 
分 为 螺旋 形 或 椭圆 形 。 最 后 ， 整 合 所 有 结果 以 得 出 一 个 一 致 的 结果 。 以 星 
系 动 物 园 为 例 就 是 ， 通 过 清洗 、 偏 差 消 除 和 加 权 ， 得 出 每 个 星系 的 一 致 分 
类 。 尽 管 大 多 数 项 目 都 会 采用 这 一 通用 的 策略 ， 但 需要 根据 所 处 理 的 具体 
问题 对 每 个 步骤 进行 相应 的 调整 。 例 如 ， 下 面 这 个 人 本 计算 项 目 采 用 的 也 
是 这 个 策略 ， 但 运用 和 整合 这 两 个 步骤 是 截然 不 同 的 。 


对 星系 动物 园 的 团队 来 说 ， 这 个 项 目 仅 仅 是 个 开始 。 很 快 他 们 便 意识 到 ， 

尽管 能 对 将 近 100 万 个 星系 进行 分 类 ， 但 这 个 规模 还 不 足以 配合 新 的 大 约 

能 拍 到 100 亿 个 星系 的 数字 天 空 勘测 (Kuminski et al. 2014 ) 。 要 想 应 对 
从 100 万 到 100 亿 的 增长 ， 也 就 是 10000 倍 的 增长 ， 他 们 需要 招募 的 参与 者 
数量 大 致 是 星系 动物 园 这 个 项 目的 10000 倍 。 尽 管 互联 网 上 的 志愿 者 很 


多 ， 但 也 不 是 无 限 的 。 因 此 ， 研 究 人 员 意 识 到 ， 如 果 他 们 想 要 处 理 数据 量 
日 益 增多 的 数据 ， 就 需要 一 个 新 的 、 更 具 扩 展 性 的 方法 。 


于 是 ， 曼 达 : 班 纳 吉 ( Manda Banerji) 同 肖 文 斯 基 、 林 托 特 和 星系 动物 园 
团队 的 其 他 成 员 一 起 ， 开 始 教 计算 机 进行 星系 分 类 。 更 具体 地 说 就 是 ， 班 
纳 吉 利用 星系 动物 园 所 创建 的 人 工分 类 数据 建立 了 一 个 机 器 学 习 模 型 ， 它 
能 够 根据 图 像 特征 预测 星系 的 人 工分 类 结果 。 如 果 该 模型 的 预测 精度 很 高 
的 话 ， 那 么 星系 动物 园 的 研究 人 员 基 本 就 能 用 它 对 无 限 的 星系 进行 分 类 
if: 


班 纳 吉 和 同事 方法 的 核心 实际 上 和 社会 研究 中 常用 的 技术 非常 相似 ， 尽 管 
乍 一 看 这 种 相似 性 可 能 并 不 明显 。 首 先 ， 班 纳 吉 和 同事 将 每 张 图 像 转 化 成 
了 一 组 概括 其 性 质 的 数字 特征 。 例 如 ， 星系 图 像 可 以 有 三 个 特征 : 图 像 中 
蓝 色 像素 点 数量 、 像 素 亮度 方差 、 非 白 像 素 比 例 。 选 择 正确 的 特征 是 这 一 
问题 的 重要 部 分 ， 这 通常 需要 专业 领域 的 专业 知识 。 这 第 一 步 通常 被 称 为 
特征 工程 ， 经 过 这 一 步 ， 班 纳 吉 和 同事 构建 了 一 个 数据 矩阵 ， 每 一 张 图 集 
都 由 一 行 和 三 列 数据 描述 。 根 据 该 数据 矩阵 和 期 望 输出 值 ( 例如 ， 如 采用 
人 工分 类 ， 某 一 图 像 是 否 会 被 划分 为 椭圆 星系 ) ， 研 究 人 员 可 以 构建 一 个 
统计 或 机 器 学 习 模型 ， 例 如 还 辑 回归 ， 以 此 根据 图 像 的 特征 预测 人 工分 类 
的 结果 。 最 后 ， 研 究 人 员 可 以 利用 该 统计 模型 中 的 参数 预测 出 新 的 星系 的 
分 类 (图 5.4 ) 。 在 机 器 学 习 中 ， 这 种 利用 标签 示例 创建 一 个 能 标记 新 数 
据 的 模型 的 方法 被 称 为 监督 式 学 习 。 


班 纳 吉 和 同事 的 机 器 学 习 模 型 的 特征 ， 比 我 下 面 这 个 虚构 的 小 例子 的 特征 
要 复杂 得 多 。 在 这 个 例子 中 ， 研 究 人 员 选 择 “ 德 伏 古 勒 轴 比 ”( de 
Vaucouleurs fit axial ratio ) 这 样 的 性 质 作 为 特征 ， 使 用 的 模型 也 不 是 逻 
辑 回归 ， 而 是 一 个 人 工 神经 网 络 。 利 用 选择 好 的 特征 、 模 型 和 星系 动物 园 
的 一 致 分 类 ， 她 算出 了 每 个 特征 的 权重 ， 然 后 利用 这 些 权 重 对 星系 的 分 类 
进行 预测 。 例 如 ， 她 经 过 分 析 发 现 ,“ 德 伏 古 勒 轴 比 ” 较 低 的 图 像 更 有 可 能 
属于 螺旋 星系 。 有 了 这 些 权 重 ， 她 便 能 相对 准确 地 预测 一 个 星系 的 人 工分 
类 结果 了 。 


蓝 色 像 素 点 像素 亮度 | IF ARR 
数量 方差 比例 


0.12 6.23 0.68 


训练 机 器 
学 习 模型 


0.78 4.71 0.62 0 | | 
———+ 星 系 动物 bel 
。 “| 分 类 数据 
e e 
© e e o 
e e e 
0.08 5.23 0.73 1 
0.85 6.23 0.58 à 
0.82 3.12 0.64 
0 
预测 的 分 类 
e Me Ha 
: . 机 利用 机 器 数据 
。 | 学 模型 | 。 
e 


0.11 2.23 0.86 


图 5.4 班 纳 吉 等 人 利用 星系 动物 园 的 分 类 数据 训练 一 个 机 器 学 习 模型 进行 
星系 分 类 的 简化 示意 图 。 星 系 图 像 被 转换 成 了 一 个 特征 矩阵。 在 这 个 简化 
的 例子 中 ， 星 系 图 像 有 三 个 特征 ( 图 像 中 蓝 色 像素 点 数量 、 像 素 亮度 方 
差 、 非 白 像素 比例 ) 。 然 后 ， 他 们 利用 星系 动物 园 的 分 类 数据 训练 一 个 机 
器 学 习 模型 。 最 后 ， 他 们 利用 这 个 机 器 学 习 模 型 预测 星系 动物 园 分 类 数据 
中 未 涉及 的 其 他 星系 的 分 类 。 我 称 之 为 计算 机 辅助 人 本 计算 项 目 ， 因 为 它 
不 是 让 人 来 解决 问题 ， 而 是 让 人 构建 一 个 数据 集 ， 然 后 用 这 个 数据 集训 练 
计算 机 来 解决 问题 。 这 种 计算 机 辅助 人 本 计算 系统 的 优点 是 ， 它 能 让 你 用 
有 限 的 人 力 处 理 几乎 无 限 的 数据 。 星 系 图 像 经 允许 复制 自 斯 隆 数 字 天 空 勘 
测 计划 。 


班 纳 吉 和 同事 的 工作 让 星系 动物 园 变 成 了 我 所 说 的 计算 机 辅助 人 本 计算 系 
统 。 对 这 类 混合 系统 最 好 的 解读 方式 是 ， 它 们 不 是 让 人 来 解决 问题 ， 而 是 
让 人 构建 一 个 数据 集 ， 然 后 用 这 个 数据 集训 练 计算 机 来 解决 问题 。 有 时 ， 
训练 计算 机 来 解决 问题 需要 大 量 的 示例 ， 而 获得 足够 数量 示例 的 唯一 方法 
就 是 大 规模 协作 。 这 种 计算 机 辅助 方法 的 优点 是 它 能 让 你 用 有 限 的 人 力 处 
理 几乎 无 限 的 数据 。 例 如 ， 一 个 拥有 100 万 个 星系 的 人 工分 类 数据 的 研究 
人 员 可 以 构建 一 个 预测 模型 ， 然 后 用 这 个 模型 对 10 亿 甚至 10000 亿 个 星系 
进行 分 类 。 如 果 星 系 的 数量 很 庞大 ， 那 么 这 种 人 与 计算 机 的 混合 系统 将 是 
唯一 可 能 的 解决 办 法 。 然 而 这 种 无 限 的 可 扩展 性 并 不 是 没有 成 本 的 。 构 建 
一 个 能 够 正确 预测 人 工分 类 结果 的 机 器 学 习 模 型 本 身 就 是 一 个 难题 ， 但 幸 
好 已 经 有 一 些 针 对 这 一 主题 的 优秀 书籍 了 (Hastie, Tibshirani, and 
Friedman 2009; Murphy 2012; James et al. 2013), 


星系 动物 园 很 好 地 表明 了 许多 人 本 计算 项 目 是 如 何 逐 步 发 展 的 。 首 先 ， 一 
个 研究 人 员 会 自行 或 与 一 小 组 研究 助理 一 起 尝试 开展 一 个 项 目 (例如 肖 文 
斯 基 最 初 所 进行 的 分 类 ) 。 如 果 这 个 方法 在 规模 上 不 能 满足 要 求 ， 那 么 研 
究 人 员 就 会 选择 采用 有 许多 参与 者 的 人 本 计算 。 但 在 数据 量 达到 一 定 规 模 
后 ， 单纯 依靠 人 力 就 不 足以 解决 问题 了 。 在 这 种 时 候 ， 研 究 人 员 就 需要 构 
建 一 个 计算 机 辅助 人 本 计算 系统 ， 利 用 人 工分 类 数据 训练 一 个 基本 能 够 处 
理 无 限 数据 的 机 器 学 习 模 型 。 


5.2.2 政治 宣言 的 公众 编码 


通常 由 专家 进行 的 政治 宣言 编码 也 可 以 通过 人 本 计算 来 完成 ， 后 者 还 能 实 
现 更 大 的 再 现 性 和 灵活 性 。 


与 星系 动物 园 的 发 起 人 相似 ， 社 会 研究 人 员 在 许多 情况 下 也 想 对 图 像 或 文 
本 进行 编码 、 分 类 或 标注 。 其 中 一 个 例子 就 是 对 政治 宣言 进行 编码 。 在 竞 
选 期 间 ， 政 党 会 发 表 表明 其 政策 立场 和 指导 思想 的 宣言 。 例 如 ， 以 下 就 是 
一 则 英国 工党 在 2010 年 的 宣言 : 


在 我 们 的 公共 服务 体系 中 工作 的 数 百 万 名 工作 人 员 ， 他 们 践 行 着 英国 最 崇 
高 的 价值 观 一 一 为 让 人 们 能 够 充分 利用 他 们 的 生命 而 贡献 自己 的 力量 并 保 
护 他 们 免 受 那些 不 应 独自 承受 的 风险 的 伤害 。 正 如 我 们 需要 让 政府 在 使 市 
场 公平 运作 方面 扮演 更 加 果敢 的 角色 ， 我 们 也 需要 果敢 地 对 政府 进行 改 
革 。 


对 于 政治 科学 家 ， 尤 其 是 那些 研究 竞选 和 政策 辩论 动态 的 政治 科学 家 来 
说 ， 这 些 宣言 包含 了 非常 有 价值 的 数据 。 为 了 系统 地 从 这 些 宣言 中 提取 信 
息 ， 研 究 人 员 创建 了 一 个 宣言 项 目 ， 共 搜集 了 50 个 国家 的 近 1000 个 政党 
所 发 表 的 4000 则 宣言 ， 然 后 组 织 政治 科学 家 采用 56 类 方案 对 每 则 宣言 的 


每 句 话 进行 了 系统 的 编码 ， 最 终 建 立 了 一 个 庞大 的 数据 集 ， 整 合 了 这 些 
言 中 所 包含 的 信息 。 目 前 已 有 200 多 篇 科学 论文 使 用 了 该 数据 集 。 


BES D133 (Kenneth Benoit ) 和 同事 决定 把 以 前 由 专家 进行 的 宣言 编 
码 转化 成 一 个 人 本 计算 项 目 。 于 是 ， 他 们 创建 了 一 个 更 具 再 现 性 和 灵活 性 
的 编码 过 程 ， 其 低 成 本 和 快速 就 更 不 在 话 下 。 


贝 努 瓦 和 同事 采用 分 解 - 运 用 -整合 这 一 策略 ， 让 来 自 微 任务 劳动 力 市 场 

(机 器 人 MTurk 和 众 包 公司 CrowdFlower 都 是 微 任务 劳动 力 市 场 的 例子 , 
更 多 有 关 该 类 市 场 的 内 容 可 参见 第 4 章 ) 的 工人 对 英国 从 1987 年 到 2010 年 
间 的 6 次 大 选 所 发 表 的 18 则 宣言 进行 了 编码 。 首 先 ， 研 究 人 员 将 每 则 宣言 
分 解 为 一 个 个 和 句子。 然后， 工人 运用 编码 方案 对 每 句 话 进行 编码 。 具 体 来 
说 ， 他 们 被 要 求 将 每 句 话 归 类 为 经 济 政策 ( 偏 左 或 偏 右 ) 、 社 会 政策 CE 
由 主义 或 保守 主义 ) 或 两 者 都 不 是 ( 图 5.5 ) 。 每 句 话 都 大 约 有 5 个 不 同 的 
人 对 其 进行 分 类 。 最 后 ， 在 考虑 个 人 因素 影响 和 句子 难度 影响 的 前 提 下 , 
研究 人 员 利 用 一 个 统计 模型 对 所 有 分 类 数据 进行 整合 。 最 终 贝 努 瓦 和 同事 
从 大 约 1500 名 工人 那里 搜集 了 20 万 条 分 类 数据 。 


ID 
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图 5.5 贝 努 瓦 等 人 的 编码 方案 。 工 人 被 要 求 将 每 句 话 归 类 为 经 济 政策 ( 偏 
左 或 偏 右 ) 、 社 会 政策 (自由 主义 或 保守 主义 ) 或 两 者 都 不 是 。 改编 自 
Benoit et al. (2016) ， 图 1。 


为 了 评估 上 述 公 众 编码 的 质量 ， 贝 努 瓦 和 同事 还 让 大 约 10 名 专家 ， 即 政治 
科学 领域 的 教授 和 研究 生 ， 用 类 似 的 步骤 对 相同 的 宣言 进行 了 编码 。 尽 管 
公众 分 类 的 个 体 一 致 性 低 于 专家 ， 但 经 过 整合 所 得 出 的 公众 一 致 分 类 数据 
与 专家 一 致 分 类 数据 吻合 度 非常 高 ( 图 5.6 ) 。 与 星系 动物 园 一 样 ， 上 述 
比较 表明 人 本 计算 项 目 也 能 产生 高 质量 的 结果 。 


[image] 


图 5.6 在 对 英国 政党 发 表 的 18 则 宣言 进行 编码 时 ， 公 众 编码 评估 结果 与 专 
家 编码 评估 结果 吻合 度 非 常 高 。 上 述 宣言 是 6 次 大 选 (1987 年 、1992 年 、 
1997 年 、2001 年 、2005 年 和 2010 年 ) 期 间 三 个 政党 (保守 党 、 工 党 和 自 
由 民主 党 ) 所 发 表 的 。 改 编 自 Benoit et al. (2016) ， 图 3。 


在 此 基础 上 ， 贝 努 瓦 和 同事 利用 他 们 的 公众 编码 方法 ， 开 展 了 宣言 项 目 专 
家 无 法 完成 的 研究 。 例 如 ， 宣言 项 目的 编码 方案 并 没有 涉及 移民 这 一 话 

题 ， 因 为 在 制订 编码 方案 的 20 世 纪 80 年 代 中 期 ， 移 民 并 不 是 一 个 很 突出 的 
话题 。 但 让 宣言 项 目 团队 返回 去 重新 编码 他 们 的 宣言 以 获取 这 一 信息 在 组 
织 实 施 上 是 不 可 行 的 。 因 此 ， 有 兴趣 研究 移民 政治 的 研究 人 员 似 乎 不 太 走 


运 。 但 贝 努 瓦 和 同事 利用 他 们 的 人 本 计算 方法 可 以 轻松 且 快 速 地 进行 这 一 
编码 。 


为 了 研究 移民 政策 ， 他 们 对 英国 2010 年 大 选 期 间 8 个 政党 所 发 表 的 宣言 

行 了 编码 。 每 则 宣言 中 的 每 个 句子 都 需 按 照 其 是 否 与 移民 有 天 来 编码 ， 如 
果 有 关 ， 还 要 判断 是 支持 移民 、 中 立 ， 还 是 反对 移民 。 项 目 启动 后 5 个 小 

时 内 ， 他 们 就 搜集 到 了 22000 多 条 回复 ， 总 成 本 是 360 美 元 。 而 且 ， 公 众 

的 评估 结果 与 之 前 专家 的 评估 结果 吻合 度 非常 高 。 两 个 月 之 后 ， 他 们 又 让 
公众 对 相同 的 宣言 进行 了 一 次 编码 ， 作 为 最 后 的 检测 。 然 后 ， 他 们 在 几 小 
时 内 便 创 建 了 一 个 新 的 与 最 初 的 公众 编码 数据 集 高 度 匹 配 的 公众 编码 数据 
集 。 换 名 话说， 人 本 计算 使 研究 人 员 能 够 生成 与 专家 评估 一 致 的 政治 文本 
编码 数据 ， 而 且 该 数据 还 具有 再 现 性 。 此 外 ， 因 为 人 本 计算 快速 且 便宜 ， 
所 以 他 们 可 以 很 容易 地 根据 移民 政策 这 一 特定 的 研究 问题 来 调整 他 们 的 数 


据 采 集 。 
5.2.3 结论 
人 本 计算 能 让 你 拥有 1000 名 研究 助理 。 


人 本 计算 项 目 能 够 通过 凝聚 许多 非 专 业 人 士 的 力量 ， 解 决 那些 计算 机 难以 
双 易 解决 的 任务 简单 、 数量 庞大 的 问题 。 这 类 项 目 会 采取 分 解 - 运 用 -整合 
这 一 策略 将 一 个 大 问题 分 解 成 许多 简单 的 、 没 有 专业 技能 的 人 也 能 完成 的 
微 任 务 。 计 算 机 辅助 人 本 计算 系统 还 会 利用 机 器 学 习 放 大 人 工 成 果 的 意 
义 。 


在 社会 研究 中 ， 当 研究 人 员 想 要 对 图 像 、 视 频 或 文本 进行 分 类 、 编 码 或 标 
注 时 ， 最 有 可 能 用 到 人 本 计算 。 他 们 最 终 的 目的 通常 并 不 是 分 类 ， 而 是 在 
分 类 的 基础 上 进行 分 析 。 例 如 ， 研 究 人 员 可 以 将 对 政治 宣言 公众 编码 数据 
的 分 析 ， 作 为 对 政治 辩论 动态 这 一 更 大 课题 的 分 析 的 一 部 分 。 效 果 最 好 的 
可 能 是 不 需要 参与 者 接受 专门 的 训练 且 参 与 者 对 任务 的 正确 答案 有 着 广泛 
共识 的 分 类 微 任务 。 如 果 分 类 任务 更 具 主 观 性 ， 例 如 判断 “这 篇 新 闻 报道 

有 偏见 吗 ”, 那么 了 解 参与 者 是 谁 以 及 他 们 的 答案 可 能 会 有 怎样 的 偏差 将 

变 得 更 加 重要 。 最 后 ， 人 本 计算 项 目的 输出 质量 取决 于 人 工 输 入 的 质量 : 

输入 垃圾 ， 则 输出 垃圾 。 


为 了 进一步 增强 你 对 人 本 计算 的 直觉 ， 表 5.1 还 列 出 了 将 人 本 计算 用 于 社 
会 研究 的 其 他 例子 。 该 表格 表明 ， 与 星系 动物 园 不 同 的 是 ， 许 多 其 他 人 本 
计算 项 目 使 用 的 是 微 任务 劳动 力 市 场 (例如 机 器 人 MTurk 平 台 ) ， 即 其 依 
靠 花 钱 雇 人 完成 任务 ， 而 不 是 依靠 志愿 者 来 完成 。 当 我 提供 有 关 如 何 创建 
自己 的 大 规模 协作 项 目的 建议 时 ， 将 再 回 到 参与 者 激励 这 个 话题 。 


75.1 社会 研究 中 的 人 本 计算 项 目的 例子 
数据 类 型 
政党 宣言 编码 微 任 务 劳 动力 市 场 | Benoit et al.( 2016) 


从 有 关 美 国 200 个 城市 的 占 
领 抗 议 的 新 闻 文 章 中 提取 事 文本 微 任务 劳动 力 市 场 Adams( 2016 ) 
件 信 息 


Budak, Goel, and 


RAR CHEAP HK 文本 微 任务 劳动 力 市 场 
报纸 分 微 任务 劳动 力 市 场 i 


从 第 一 次 世界 大 战士 兵 的 日 
记 中 提取 事件 信息 


志愿 者 Grayson ( 2016 ) 


发 现 地 图 中 的 变化 微 任务 劳动 力 市 场 | Soeller et al.( 2016 ) 


Porter Verdery, and 


微 任 务 劳动 力 市 场 
微 任 务 劳动 力 市 场 Gaddis ( 2016 ) 


最 后 ， 本 小 节 的 例子 表明 ， 人 本 计算 让 科学 变 得 大 众 化 了 。 肖 文 斯 基 和 林 
托 特 开始 创建 星系 动物 园 时 都 还 只 是 研究 生 。 在 数字 时 代 之 前 ， 一 个 对 百 
万 星系 进行 分 类 的 项 目 应 该 需要 花费 大 量 时 间 和 金钱， 因此 可 能 只 有 资金 
充足 和 有 和 耐心 的 教授 才能 够 开展 。 现 在 却 不 同 了 。 人 本 计算 项 目 通过 凝聚 
许多 非 专 业 人 士 的 力量 ， 也 能 解决 那些 任务 简单 、 数 量 庞大 的 问题 。 接 下 
来 我 将 向 大 家 展示 ， 大 规模 协作 也 适用 于 需要 专业 知识 的 问题 ， 而 这 种 专 
业 知 识 有 时 甚至 连 研究 人 员 自 己 也 不 具备 。 


5.3 公开 征集 


公开 征集 旨 在 为 明确 具体 的 目标 征集 新 想法 ， 它 适用 于 “检验 解决 方案 比 
想 出 解决 方案 更 容易 ”的 情形 。 


就 上 一 小 节 所 描述 的 人 本 计算 问题 来 说 ， 研 究 人 员 是 知道 如 何 解决 这 些 问 
题 的 ， 只 是 没有 足够 的 时 间 。 也 就 是 说 ， 如 果 凯 文 ' 肖 文 斯 基 有 无 限 的 时 间 
的 话 ， 他 自己 也 能 完成 对 100 万 个 星系 的 分 类 。 然 而 有 时 候 ， 研 究 人 员 所 
面临 的 挑战 不 是 来 自 规模 方面 ， 而 是 来 自任 务 本 身 固 有 的 难度 。 在 过 去 ， 
面临 这 类 挑战 的 研究 人 员 可 能 会 向 同事 寻求 帮助 。 而 现在 ， 这 类 问题 还 可 
以 通过 创建 一 个 公开 征集 项 目 来 解决 。 如 果 你 曾 想 过 “我 不 知道 该 如 何 解 
决 这 个 问题 ， 但 我 确信 一 定 有 人 知道 ”, 那么 就 可 以 通过 公开 征集 解决 这 


个 问题 。 


在 公开 征集 项 目 中 ， 研 究 人 员 首 先 提 出 一 个 问题 ， 向 许多 人 征集 解决 方 
案 ， 然 后 从 解决 方案 中 挑选 最 好 的 。 把 一 个 对 自己 来 说 很 有 挑战 性 的 问题 
当 作 研究 课题 ， 然 后 借助 公众 来 解决 这 个 问题 ， 这 似乎 有 点 奇怪 ， 但 我 希 
望 通过 计算 机 科学 、 生 物 学 和 法 律 领域 的 三 个 例子 ， 让 大 家 相信 这 种 方法 
很 有 效 。 这 三 个 例子 表明 ， 创 建 一 个 成 功 的 公开 招募 项 目 ， 天 键 在 于 仔细 
设计 你 的 问题 ， 尽 管 难以 想 出 其 解决 方案 ， 但 你 可 以 让 该 解决 方案 易于 检 
验 。 然 后 在 本 小 节 的 最 后 ， 我 将 更 多 地 描述 如 何 将 这 些 想法 应 用 于 社会 研 
Ao 


5.3.1 网 飞 奖 
网 飞 奖 通过 公开 征集 来 预测 人 们 会 喜欢 哪 部 电影 。 


最 著名 的 公开 招募 项 目 是 网 飞 奖 。 网 飞 是 一 家 在 线 电影 租赁 公司 ， 它 于 
2000 年 推出 了 电影 匹配 (Cinematch ) ， 一 个 向 用 户 推荐 电影 的 服务 系 
统 。 例 如 ， 电 影 匹 配 可 能 注意 到 你 喜欢 《星球 大 战 》 和 《帝国 反击 战 》 ， 
然后 据 此 向 你 推荐 《绝地 归来 》。 起 初 ， 电影 匹配 的 表现 差强人意 。 在 过 
去 的 许多 年 里 ， 它 一 直 在 不 断 提高 预测 用 户 喜好 的 能 力 。 到 2006 年 ， 电 影 
匹配 却 停滞 不 前 了 。 网 飞 的 研究 人 员 几 乎 党 试 了 所 有 他 们 能 想到 的 东西 ， 
但 同时 他 们 猜想 可 能 还 有 其 他 想法 能 帮助 改进 这 个 系统 。 于 是 ， 他 们 想到 
了 一 个 在 当时 来 说 非常 前 卫 的 解决 方案 : 公开 征集 。 


对 网 飞 奖 最 终 的 成 功 起 到 至 关 重 要 作用 的 是 公开 征集 的 设计 ， 这 个 设计 对 
公开 征集 如 何 才能 被 用 于 社会 研究 也 有 着 重要 的 借鉴 意义 。 网 飞 并 没有 像 
许多 第 一 次 接触 公开 征集 这 个 概念 的 人 设想 的 那样 提出 一 个 没有 条 理 的 征 


集 想 法 ， 而 是 提出 了 一 个 明确 且 其 解决 方案 易于 检验 的 想法 : 要 求人 们 利 
用 1 亿 条 电影 评分 数据 来 预测 300 万 条 评分 留存 数据 ( 网 飞 没 有 公布 的 用 户 
评分 数据 ) 。 第 一 个 开发 出 预测 精度 比 电影 匹配 高 10% 的 算法 的 人 ， 将 获 
得 100 万 美元 的 奖金 。 而 检验 该 算法 的 方法 就 是 比较 其 预测 评分 与 网 飞 的 

留存 评分 ， 这 一 明确 且 易 行 的 检验 方案 意味 着 网 飞 奖 的 设计 遵循 了 这 样 的 
理念 : 让 检验 解决 方案 比 想 出 解决 方案 更 容易 。 它 将 改进 电影 匹配 的 挑战 
变 成 了 一 个 适 于 用 公开 征集 来 解决 的 问题 。 


2006 年 10 月 ， 网 飞 公开 了 一 个 数据 集 ， 其 中 包含 了 大 约 50 万 名 用 户 的 1 亿 
条 电影 评分 信息 ( 我们 将 在 第 6 章 中 讨论 这 一 行为 涉及 的 隐私 问题 ) 。 这 

些 数 据 可 以 被 转化 成 一 个 巨大 的 矩阵 ， 其 中 大 约 有 50 万 名 用 户 、2 万 部 电 

影 以 及 大 约 1 亿 条 从 1 星 到 5 星 的 电影 评分 信息 ( 表 5.2 ) 。 网 飞 的 要 求 就 是 
利用 和 矩阵 中 的 观测 数据 预测 300 万 条 留存 评分 。 


表 5.2 网 飞 奖 数 据 简 表 


电影 20 000 


用 户 500 000 


世界 各 地 的 研究 人 员 和 黑客 都 被 这 一 挑战 吸引 了 ， 到 2008 年 ， 已 有 超过 3 
万 人 参与 其 中 (Thompson 2008 ) 。 在 比赛 过 程 中 ， 网 飞 收 到 了 来 自 
5000 多 个 团队 的 超过 40000 个 解决 方案 提议 ( Netflix 2009 ) 。 显 然 ， 网 
飞 无 法 阅读 并 理解 所 有 这 些 方案 。 但 整 件 事情 进展 很 顺利 ， 因 为 网 飞 很 容 
易 对 解决 方案 进行 验证 。 网 飞 只 需 让 一 台 计 算 机 按照 预先 指定 的 度量 标准 
(他 们 当时 采用 的 度量 标准 是 均 方 误差 的 平方 根 ) 对 预测 评分 和 留存 评分 
进行 比较 即 可 。 正 是 这 种 快速 评估 解决 方案 的 能 力 ， 使 网 飞 能 够 评估 每 个 
团队 的 解决 方案 ， 而 事实 证 明 这 一 点 很 重要 ， 因 为 好 的 创意 确实 来 自 一 些 
令 人 惊讶 的 地 方 。 事 实 上 ， 获胜 的 解决 方案 来 自 一 个 由 三 位 没有 电影 推荐 
系统 构建 经 验 的 研究 人 员 所 组 建 的 团队 (Bell, Koren, and Volinsky 
2010), 


网 飞 奖 比较 好 的 一 点 是 所 有 方案 都 能 得 到 公平 的 评估 。 也 就 是 说 ， 当 人 们 


上 传 预测 评分 数据 时 ， 无 须 上 传 学 历 、 年 龄 、 种 族 、 性 别 、 性 取向 或 其 他 
任何 有 关 个 人 的 信息 。 斯 坦 福 大 学 一 位 著名 教授 的 预测 评分 与 一 位 青少年 


在 其 卧室 中 完成 的 预测 评分 所 接受 的 评估 是 完全 相同 的 。 不 幸 的 是 ， 大 多 
数 社会 研究 却 不 是 这 样 的 。 也 就 是 说 ， 对 大 多 数 社 会 研究 来 说 ， 评 估 是 非 
常 耗 时 的 ， 而 且 在 一 定 程度 上 是 具有 主观 性 的 。 所 以 ， 大 多 数 的 研究 想法 
从 来 都 没有 被 认真 评估 过 ， 而 且 在 评估 时 ， 评 估 者 也 很 难 完全 不 考虑 提出 
者 身份 这 一 因素 。 而 公开 征集 项 目 则 有 着 公平 易 行 的 评估 体系 ， 所 以 它 可 
以 发 现 那些 如 果 采 用 其 他 方法 就 会 被 忽略 的 想法 。 


例如 ， 在 比赛 期 间 ， 有 一 个 账号 名 为 西蒙 . 芬 克 (Simon Funk ) 的 人 在 他 
的 博客 上 发 布 了 一 个 基于 奇异 值 分 解 的 解决 方案 提议 ， 这 是 一 个 线性 代数 
的 方法 ， 其 他 参与 者 都 未 曾 提 到 这 一 方法 。 芬 克 这 篇 博文 既 专 业 又 很 奇怪 
地 不 大 正式 。 它 描述 的 是 一 个 好 的 解决 方案 ， 还 是 完全 没 用 的 东西 ? WR 
这 不 是 一 个 公开 征集 项 目的 话 ， 该 解决 方案 可 能 永远 也 不 会 被 认真 评估 。 
毕竟 ， 西 蒙 芬 克 并 不 是 麻 省 理工 学 院 的 一 位 教授 ， 他 只 是 一 名 软件 开发 人 
员 ， 当 时 正在 新 西 兰 背 包 旅行 ( Piatetsky 2007 ) 。 如 果 他 当时 通过 邮件 
把 这 个 想法 发 送 给 网 飞 的 一 位 工程 师 ， 那 么 几乎 可 以 肯定 的 是 ， 这 位 工程 
师 并 不 会 认真 评估 这 个 想法 。 


幸运 的 是 ， 因 为 网 飞 奖 的 评估 标准 很 明确 且 评 估 易 于 实施 ， 所 以 芬 克 的 预 
测评 分 得 到 了 评估 ， 而 且 结 果 很 快 就 出 来 了 ， 他 的 方法 显然 非常 有 效 : 他 
的 排名 一 下 子 飙 逢 到 了 第 4 位 。 考 虑 到 其 他 团队 在 这 个 问题 上 已 经 奋战 了 
数 月 ， 这 无 疑 是 一 个 惊人 的 结果 。 最 后 ， 几 乎 所 有 认真 对 待 这 次 比赛 的 竞 
争 者 都 采用 了 他 的 部 分 方法 (Bell, Koren, and Volinsky 2010 ) 。 


西蒙 . 芬 克 选择 通过 一 篇 博文 来 前 述 他 的 方法 ， 而 不 是 试图 避免 让 别人 知道 
这 个 方法 ， 这 也 表明 网 飞 奖 的 许多 参与 者 并 不 仅仅 是 因为 百 万 美元 的 奖金 
才 参 与 比赛 的 。 更 确切 地 说 ， 许 多 参与 者 似乎 也 是 为 了 享受 这 个 问题 所 带 
来 的 智力 挑战 和 由 此 而 形成 的 团体 (Thompson 2008) ， 我 觉得 许多 研究 
人 员 都 能 够 理解 这 种 感觉。 


网 飞 奖 是 公开 征集 的 一 个 经 典 示 例 。 网 飞 提 出 了 一 个 有 着 明确 目标 〈 预测 

影评 分 ) 的 问题 ， 并 向 许多 人 征集 该 问题 的 解决 方案 。 网 飞 之 所 以 能 够 
评估 所 有 这 些 解决 方案 ， 是 因为 验证 这 些 解决 方案 要 比 想 出 解决 方案 更 加 
容易 。 最 终 ， 网 飞 经 过 验证 挑选 出 了 最 好 的 解决 方案 。 接 下 来 ， 我 将 向 大 
家 展示 如 何 将 同样 的 方法 应 用 于 生物 学 和 法 律 领域 ， 并且 是 在 没有 百 万 美 
元 奖金 的 情况 下 。 


5.3.2 HAT EX 
& Aad Bie (Foldit) 可 以 让 非 专业 人 士 以 一 种 有 趣 的 方式 参与 进 
来 。 


网 飞 奖 尽管 很 经 典 且 明确 易 懂 ， 但 通过 它 并 不 能 阐明 公开 征集 项 目的 所 有 
内 容 。 例 如 ， 在 网 飞 奖项 目 中 ， 大 多 数 认真 对 待 比赛 的 参与 者 都 受过 多 年 
统计 学 和 机 器 学 习 方面 的 训练 。 但 公开 征集 项 目 其 实 也 可 以 让 没有 接受 过 
正式 训练 的 人 参与 ， 蛋 白质 折 葡 游戏 就 是 这 样 。 


蛋白 质 折 苔 是 将 氨基 酸 链 折 全 形成 一 定形 状 的 过 程 。 通 过 更 好 地 理解 这 一 
过 程 ， 生 物 学 家 可 以 设计 出 具有 特定 形状 的 、 能 被 用 作 药 物 的 蛋白 质 。 简 
单 地 说 ， 蛋 白质 的 折叠 趋 向 于 能 量 最 低 的 构象 ， 即 蛋白 质 内 部 各 种 推力 、 

拉力 达到 平衡 状态 时 的 一 种 结构 (图 5.7 ) 。 所 以 ， 如 果 一 个 研究 人 员 想 

要 预测 蛋白 质 的 折 共 形状 ， 其 做 法 听 起 来 其 实 很 简单 : 只 需 尝 试 所 有 可 能 
的 构象 并 计算 出 每 种 构象 的 能 量 ， 然 后 预测 蛋白 质 将 折 全 成 能 量 最 低 的 构 
象 即 可 。 不 幸 的 是 ， 尝 试 所 有 可 能 的 构象 从 计算 上 来 讲 是 不 可 能 的 ， 因 为 
可 能 的 构象 有 数 十 亿 种 。 即 便 用 现在 最 强大 的 计算 机 来 做 ， 在 可 预见 的 未 
来 ， 这 样 的 蛮 力 也 不 会 起 作用 。 因 此 ， 生 物 学 家 开发 了 许多 巧妙 的 算法 来 
有 效 地 寻找 最 低能 量 的 构象 。 但 是 ， 尽 管 在 科学 和 计算 方面 付出 了 巨大 的 


努力 ， 这 些 算法 还 是 远 远 不 够 完善 。 


图 5.7 SARs. 


华盛顿 大 学 的 戴 维 :贝克 (David Baker) 和 他 的 研究 小 组 同 许多 科学 家 一 
样 致力 于 研究 蛋白 质 折 苔 的 计算 方法 。 在 一 个 项 目 中 ， 贝 克 和 同事 开发 了 
一 个 系统 ， 志 愿 者 可 以 利用 空 闪 时 间 在 他 们 的 计算 机 上 通过 这 一 系统 模拟 
蛋白 质 折 硬 。 作 为 回报 ， 他 们 所 模拟 的 折 双 方案 可 以 成 为 他 们 计算 机 的 屏 
幕 保护 图 。 然 后 ， 一 些 志 愿 者 写 信 给 贝克 和 他 的 同事 说 ， 他 们 认为 如 果 自 
己 能 参与 计算 ， 就 能 提高 计算 机 在 预测 蛋白 质 折 双方 面 的 性 能 。 于 是 蛋白 
质 折 又 游戏 便 诞 生 了 (Hand 2010), 


蛋白 质 折 难 游 戏 将 蛋 犁 质 的 折 芭 过 程 变 成 了 一 个 任何 人 都 可 以 玩 的 游戏 。 


从 玩家 的 角度 来 看 ， 蛋 白质 折合 游戏 就 像 是 一 个 拼图 游戏 ( 图 5.8 ) i 
家 会 看 到 一 个 杂乱 无 章 的 蛋白 质 三 维 结构 图 ， 然 后 通过 “调整 " “所 

转 ” 和 “重组 ”这 些 操作 来 改变 它 的 形状 ， 同 时 玩家 的 分 数 也 会 因此 而 增加 或 
减少 。 重 要 的 是 ， 分 数 是 根据 当前 构象 的 能 量 高 低 来 计算 的 ， 能 量 越 低 , 
得 分 越 高 。 换 名 话说 ， 分数 有 助 于 指导 玩家 寻找 低能 量 的 构象 。 就 像 网 飞 
奖 的 电影 评分 预测 一 样 ， 和 蛋白 质 折 难 游 戏 所 呈现 的 也 是 一 个 “检验 解决 方 
案 比 想 出 解决 方案 更 容易 ”的 情形 ， 也 正 因 如 此 ， 这 个 游戏 才 得 以 诞生 。 
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图 5.8 SA mi ERA EX BL. 


蛋白 质 折 双 游戏 的 巧妙 设计 使 那些 对 生物 化 学 知之 甚 少 的 玩家 也 能 与 专家 
设计 的 最 佳 算法 竞争 。 尽 管 大 多 数 玩 家 都 不 是 特别 擅长 ， 但 也 有 少量 个 体 
玩家 和 小 团队 玩家 例外 。 事 实 上 ， 在 玩家 与 最 先进 的 算法 的 正面 交锋 中 ， 
玩家 的 折 又 方案 更 胜 一 筹 的 概率 是 50% ( Cooper et al. 2010 ) 。 


蛋白 质 折 双 游 戏 和 网 飞 奖 在 许多 方面 都 不 一 样 ， 但 它们 都 公开 征集 解决 方 
案 ， 而 且 都 是 “检验 解决 方案 比 想 出 解决 方案 更 容易 ”。 现 在 ， 我 们 将 在 另 
一 个 非常 不 同 的 领域 看 到 相同 的 结构 : 专利 法 。 最 后 这 个 公开 征集 的 例子 
表明 ， 这 一 方法 也 适用 于 看 起 来 不 是 很 易于 量化 的 情形 。 


5.3.3 公众 专利 评审 


公众 专利 评审 是 一 项 帮助 专利 审查 员 发 现 现 有 技术 的 公开 征集 项 目 。 它 表 
明 公 开征 集 也 可 以 被 用 于 不 易 量 化 的 问题 。 


专利 审查 员 的 工作 是 很 辛苦 的 。 他 们 会 收 到 关于 新 发 明 的 、 简 洁 的 、 如 律 
师 般 措 套 严谨 的 描述 文件 ， 然 后 必须 决定 该 发 明 是 否 “ 新 笑 ”。 也 就 是 说 , 
审查 员 必 须 审查 是 否 存在 会 使 所 陈述 的 发 明 无 法 获得 专利 的 “ 现 有 技 

术 ”( 之 前 已 有 对 所 陈述 发 明 的 描述 文件 ) 。 我 们 可 以 通过 一 个 名 叫 阿尔 
伯 特 ( 为 了 纪念 阿尔 伯 特 : 爱 因 斯 坦 ) 的 专利 审查 员 来 理解 这 个 过 程 是 如 何 
运作 的 。 阿 尔 伯 特 的 职业 生涯 开始 于 瑞士 专利 局 ， 他 可 能 会 收 到 一 份 类 似 
于 美国 专利 20070118658 的 申请 。 美 国 专利 20070118658 是 惠普 为 其 “用 
户 可 选 管理 警报 格式 ”所 申请 的 ， 贝 丝 . 诺 维 克 〈Beth Noveck ) 的 《维基 政 
FF) (Wiki Government) 中 有 关于 这 项 专利 的 大 量 描述 。 以 下 是 这 个 专利 
申请 的 第 一 条 权利 要 求 。 


一 个 计算 机 系统 包括 : 一 个 处 理 器 、 一 个 包括 逻辑 指令 的 基本 输入 /输出 
系统 (BIOS ) 。 当 处 理 器 执行 该 逻辑 指令 时 ， 它 便 会 对 处 理 器 进行 如 下 配 
置 : 在 一 个 计算 设备 的 基本 输入 /输出 系统 中 启动 开机 自 检 ( POST ) ,在 


用 户 界面 中 呈现 一 个 或 多 个 管理 警报 格式 ， 从 用 户 界面 接收 选择 信号 ， 识 
别 用 户 界 面 中 所 显示 的 其 中 一 个 管理 警报 格式 ， 以 及 用 已 识别 的 管理 警报 
格式 配置 一 个 与 计算 系统 相连 的 设备 。 


阿尔 伯 特 是 否 应 该 授予 这 项 申请 20 年 的 垄断 权 呢 ? 是 否 存 在 会 使 它 无 法 获 
得 专利 的 现 有 技术 ? 许多 专利 的 利害 关系 很 大 ， 但 不 幸 的 是 ， 阿 尔 伯 特 不 
得 不 在 没有 太 多 他 可 能 需要 的 信息 的 情况 下 做 出 这 个 决定 。 因 为 有 大 量 的 
专利 申请 积压 ， 所 以 阿尔 伯 特 一 直 在 巨大 的 时 间 压 力 下 工作 ， 审 查 时 间 只 
有 20 个 小 时 ， 然 后 他 必须 做 出 决定 。 此 外 ， 由 于 正在 审查 的 发 明 需 要 保 
密 ， 所 以 这 项 工作 也 不 允许 阿尔 伯 特 咨询 外 部 专家 (Noveck 2006 ) 。 


这 一 状况 让 法 学 教授 贝 丝 ' 诺 维 克 感 到 很 困惑 。2005 年 7 月 ， 在 一 定 程度 上 
受 维基 百科 的 启发， 她 写 了 一 篇 标题 为 《公众 专利 评审 : 一 个 小 的 提议 》 
的 博文 ， 呼 吁 建立 一 个 公众 专利 评审 制度 。 通 过 与 美国 专利 商标 局 以 及 
IBM (国际 商业 机 器 公司 ) 等 领先 科技 公司 合作 ， 公 众 专利 评审 于 2007 年 
6 月 正式 启动 了 。 一 个 是 有 将 近 200 年 历史 的 政府 官僚 机 构 ， 一 个 是 律师 群 
体 ， 它 们 似乎 都 不 太 可 能 寻求 创新 ， 但 公众 专利 评审 巧妙 地 为 每 个 人 找到 
了 一 个 利益 平衡 点 。 


以 下 是 公众 专利 评审 的 工作 流程 ( 图 5.9 ) 。 在 发 明 者 同意 对 他 的 申请 进 
行 公开 审查 后 〈 稍 后 我 会 分 析 这 个 人 这 么 做 的 可 能 原因 ) ， 其 申请 就 会 被 
上 传 到 一 个 网 站 。 然 后 ， 由 公众 审查 人 员 ( 稍 后 我 会 分 析 他 们 这 么 做 的 可 
能 原因 ) 组 成 的 审查 小 组 对 这 一 申请 进行 讨论 ， 并 查找 、 标 注 和 和 上传 与 之 
相似 的 现 有 技术 。 这 一 过 程 会 一 直 进 行 ， 直 到 审查 小 组 最 终 投 票选 出 最 有 
可 能 与 之 相似 的 10 个 现 有 技术 为 止 ， 然 后 他 们 会 将 这 10 个 现 有 技术 发 送 给 
专利 审查 员 进 行 审查 。 专 利 审查 员 再 自行 进行 审查 ， 然 后 结合 来 自 公 众 专 
利 评审 的 意见 做 出 最 终 判 断 。 
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图 5.9 公众 专利 评审 的 工作 流程 。 复 制 自 Bestor and Hamp (2010 ) 。 
让 我 们 再 次 回 到 有 关 “ 用 户 可 选 管理 警报 格式 ”的 美国 专利 20070118658 这 


个 话题 。 这 个 专利 是 在 2007 年 6 月 被 上 传 至 公众 专利 评审 的 ， 然 后 IBM 的 
高 级 软件 工程 师 史 蒂 夫 .皮尔 逊 (Steve Pearson ) 看 到 了 这 个 专利 的 内 容 。 


专利 申请 技术 相关 的 现 有 技术 提交 的 现 有 技术 


皮尔 逊 对 这 一 研究 领域 很 熟悉 ， 并 找到 了 一 个 现 有 技术 文献 : 一 本 标题 为 

《主动 管理 技术 : 快速 参考 指南 》 (Active Management Technology: Quick 
Reference Guide ) 的 英特尔 的 指南 手册 ， 这 本 手册 在 两 年 前 就 出 版 了 。 在 
这 份 文 件 以 及 其 他 现 有 技术 文献 和 公众 专利 评审 中 审查 小 组 讨论 的 基础 
上 ， 一 名 专利 审查 员 开 始 对 该 专利 进行 彻底 的 审查 ， 并 最 终 撤销 了 该 项 技 
术 的 专利 权 ， 部 分 原因 就 是 皮尔 逊 发 现 的 英特尔 的 指南 手册 ( Noveck 
2009 ) 。 在 通过 公众 专利 评审 所 完成 的 66 个 专利 申请 中 ， 有 近 30% 主 要 
是 因为 评审 小 组 发 现 的 现 有 技术 而 被 拒绝 授予 专利 权 的 (Bestor and 
Hamp 2010 ) 。 


公众 专利 评审 设计 的 巧妙 之 处 ， 在 于 它 为 有 许多 利益 冲突 的 相关 方 提供 了 
一 个 和 谐 协 作 的 平台 。 发 明 者 之 所 以 参与 是 因为 通过 公众 专利 评审 所 提交 
的 申请 ， 要 比 走 传统 的 秘密 审查 程序 的 申请 更 快 获得 专利 局 的 审查 。 公 众 
审查 人 员 之 所 以 参与 是 为 了 防止 低 质量 专利 产生 ， 而 且 许多 人 似乎 党 得 这 
个 过 程 很 有 趣 。 最 后 ， 专 利 局 和 专利 审查 员 之 所 以 参与 是 因为 这 个 方法 只 
会 改善 他 们 的 审查 结果 。 也 就 是 说 ， 如 果 评 审 小 组 发 现 的 是 10 个 无 用 的 现 
有 技术 文献 ， 那 么 专利 审查 员 将 它们 忽略 掉 即 可 。 换 句 话说， 有 公众 审查 
人 员 与 专利 审查 员 一 起 合作 ， 应 该 比 专利 审查 员 独 自理 战 要 好 ， 这 至 少 也 
应 该 能 达到 与 专利 审查 员 独 自 奋 战 相同 的 效果 。 因 此 ， 公 开征 集 并 不 总 是 
代替 专家 解决 问题 ， 有 时 是 帮助 专家 把 他 们 的 工作 做 得 更 好 。 


尽管 公众 专利 评审 与 网 飞 奖 和 和 蛋白质 折 区 游戏 不 太一 样 ， 但 它们 都 有 一 个 
相似 的 结构 ， 即 “检验 解决 方案 比 想 出 解决 方案 更 容易 ”。 一 旦 有 人 找到 了 
《主动 管理 技术 : 快速 参考 指南 》 这 本 手册 ， 那 么 核实 这 个 文件 是 否 是 现 
有 技术 就 容易 了 ， 至 少 对 专利 审查 员 来 说 是 这 样 的 。 然 而 发 现 这 本 手册 是 
相当 困难 的 。 公 众 专利 评审 还 表明 ， 公 开征 集 有 时 也 适用 于 不 是 很 易于 量 
化 的 问题 。 


5.3.4 结论 


公开 征集 可 以 让 你 为 那些 你 能 清楚 地 描述 但 无 法 自己 解决 的 问题 找到 解决 


方案 。 


在 上 述 三 个 公开 征集 的 项 目 ， 即 网 飞 奖 、 和 蛋白 质 折 芭 游 戏 和 公众 专利 评审 
中 ， 研 究 人 员 都 是 先 提出 一 个 特定 形式 的 问题 ， 然 后 公开 征集 解决 方案 ， 
最 后 挑选 最 好 的 解决 方案 。 研 究 人 员 甚 至 都 不 需要 知道 可 以 请 教 的 最 好 的 
专家 是 谁 ， 其 实 好 的 想法 有 时 会 来 自 意 想不到 的 地 方 。 


鉴于 我 已 经 对 人 本 计算 项 目 和 公开 征集 项 目 进行 了 介绍 ， 所 以 现在 我 可 以 
强调 两 者 之 间 的 两 个 重要 区 别 了 。 首 先 ， 在 公开 征集 项 目 中 ， 研 究 人 员 指 
定 的 是 一 个 目标 ( 例如 预测 电影 评分 ) ， 而 在 人 本 计算 项 目 中 ， 研 究 人 员 


指定 的 是 一 个 微 任务 ( 例如 对 一 个 星系 进行 分 类 ) 。 其 次 ， 在 公开 征集 项 
目 中 ， 研 究 人 员 想 要 的 是 最 好 的 贡献 ， 例 如 预测 电影 评分 的 最 好 算法 、 蛋 
白质 的 最 低能 量 构象 或 者 最 相关 的 现 有 技术 文献 ， 而 不 是 所 有 贡献 的 简单 
集合 。 

我 已 经 描述 了 公开 征集 的 通用 模板 以 及 三 个 示例 ， 那 么 社会 研究 中 的 哪些 
问题 适合 用 该 方法 来 解决 呢 ? 在 这 一 点 上 ， 我 得 承认 成 功 的 例子 还 不 是 很 
多 (我 稍 后 会 解释 原因 ) 。 就 直接 模拟 而 言 ， 我们 可 以 设想 一 下 ， 一 位 历 
史 研 究 人 员 通 过 公众 专利 评审 式 的 公开 征集 查找 最 早 提 及 某 个 特定 的 人 或 
想法 的 文件 ， 尤 其 是 当 潜 在 的 相关 文件 没有 被 归档 在 一 起 ， 而 是 广泛 分 散 
在 各 处 时 ， 公 开征 集 对 这 类 问题 的 价值 就 更 大 了 。 


更 普遍 地 讲 ， 许 多 政府 和 公司 都 有 需要 公开 征集 解决 的 问题 ， 因 为 公开 征 
集 能 够 产生 预测 算法 ， 而 这 些 预测 可 以 成 为 行动 的 重要 指南 ( Provost and 
Fawcett 2013; Kleinberg et al. 2015 ) 。 例 如 ， 就 像 网 飞 想 要 预测 电影 评 
分 一 样 ， 政 府 可 能 想 要 预测 哪 家 餐馆 最 有 可 能 违犯 卫生 法 规 等 ， 以 便 更 有 
效 地 分 配 检查 资源 。 鉴 于 此 ， 爱 德 华 . 格 莱 泽 (Edward Glaeser ) 和 同事 便 
利用 公开 征集 帮助 波士顿 市 根据 点 评 网 站 Yelp 上 的 点 评 数据 和 历史 检查 数 
据 预 测 餐 馆 的 卫生 违规 情况 。 他 们 估计 ， 通 过 公开 征集 所 选 出 的 最 好 的 预 
测 模型 能 够 将 餐馆 检查 员 的 工作 效率 提高 约 50%。 


公开 征集 还 可 能 被 用 于 比较 和 测试 理论 。 例 如 ， 脆弱 家 庭 和 儿童 福利 研究 
( Fragile Families and Child Wellbeing Study ) 对 在 美国 20 个 不 同城 市 出 
生 的 约 5000 个 孩子 进行 了 追踪 ( Reichman et al. 2001 ) 。 研 究 人 员 分 别 
在 孩子 出 生 时 以 及 1 岁 、3 岁 、5 岁 、9 岁 和 15 岁 时 搜集 了 有 关 这 些 孩 子 、 
他 们 的 家 庭 以 及 他 们 所 处 的 更 广泛 的 环境 方面 的 数据 。 那 么 研究 人 员 利 用 
所 有 这 些 数据 预测 谁 将 能 够 大 学 毕业 的 准确 度 将 如 何 呢 ? 或 者 用 有 些 研究 
人 员 更 加 感 兴 趣 的 方式 来 表达 就 是 ， 哪 些 数据 和 理论 在 预测 这 些 结果 方面 
最 有 效 ? 因为 这 些 孩子 目前 都 还 没 到 上 大 学 的 年 龄 ， 所 以 这 将 是 一 个 真正 
前 瞻 性 的 预测 ， 而 且 研究 人 员 可 能 采取 的 策略 也 有 许多 。 认 为 社区 对 大 学 
毕业 等 结果 至 关 重 要 的 研究 人 员 与 认为 家 庭 至 关 重 要 的 研究 人 员 所 采用 的 
方法 可 能 截然 不 同 。 那 么 哪 种 方法 会 更 有 效 呢 ? 我 们 并 不 知道 ， 在 寻找 答 
案 的 过 程 中 ， 我 们 可 能 会 学 到 一 些 有 关 家 庭 、 社 区 、 教 育 和 社会 不 平等 的 
重要 知识 。 此 外 ， 这 些 预测 也 许 能 被 用 来 指导 以 后 的 数据 采集 。 假 如 有 一 
小 部 分 大 学 毕业 生 在 之 前 各 种 方法 的 预测 中 都 是 不 可 能 大 学 毕业 的 ， 那 么 
这 些 人 将 是 后 续 定性 采访 和 人 种 志 观 察 的 理想 人 人选。 因此， 在 这 一 类 型 的 
公开 征集 中 ， 预 测 并 不 是 目的 ， 相 反 ， 它 们 为 比较 、 拓 展 和 结合 不 同 的 理 
论 传 统 提 供 了 一 种 新 方法 。 这 种 公开 征集 不 只 适用 于 利用 脆弱 家 庭 和 儿童 
福利 研究 的 数据 来 预测 谁 将 上 大 学 ， 它 还 可 以 预测 最 终 会 被 搜集 到 纵向 社 
会 数据 集中 去 的 所 有 结果 。 


正如 我 在 本 小 节 前 面部 分 所 写 的 ， 目 前 还 没有 很 多 社会 研究 人 员 采 用 公开 
征集 方法 的 例子 。 我 认为 这 是 因为 公开 征集 的 提问 方式 与 社会 科学 家 通常 
的 提问 方式 不 太一 样 。 社 会 科学 家 通常 不 会 问 有 关 预 测 品位 的 问题 ， 相 

反 ， 他 们 会 问 不 同 社会 阶层 的 人 的 文化 品位 为 什么 会 不 同 以 及 是 如 何不 同 
的 参阅 例如 Bourdieu 1987 ) 。 像 这 种 “如 何以 及 “为 什么 ”的 问题 ， 其 
解决 方案 通常 都 不 易于 检验 ， 因 此 似乎 不 适用 于 公开 征集 。 所 以 ， 似 乎 公 
开征 集 更 适用 于 预测 性 问题 而 不 是 解释 性 问题 。 但 最 近 理论 家 已 经 开始 呼 
吁 社会 科学 家 重新 考虑 解释 和 预测 之 间 的 分 界线 ( Watts 2014 ) 。 随 着 解 
释 和 预测 之 间 的 界线 越 来 越 模糊 ， 我 希望 公开 征集 在 社会 研究 中 能 变 得 越 
来 越 普遍 。 
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6.1 简介 


在 之 前 的 章节 中 ， 我 已 经 展示 了 数字 时 代 在 搜集 和 分 析 社 会 资源 方面 所 创 
造 的 新 机 遇 。 与 此 同时 ， 数 字 时 代 也 带 来 了 新 的 道德 伦理 挑战 。 本 章 的 目 
的 在 于 为 你 们 提供 相应 的 工具 ， 用 以 负责 地 处 理 这 些 道德 伦理 的 挑战 。 


当下 ， 一 些 数 字 时 代 社 会 研究 的 道德 伦理 问题 还 存在 着 不 确定 性 。 这 种 不 
确定 性 导致 两 种 相关 问题 产生 ， 其 中 一 个 比 另 一 个 受到 了 更 多 的 关注 。 一 
方面 ， 一 些 研究 人 员 被 指控 侵犯 了 人 们 的 隐私 权 或 者 参与 了 不 道德 的 实 
验 。 我 即将 在 本 章 描述 的 事例 ， 已 经 引起 广泛 争议 并 成 为 讨论 的 事实 主 
体 。 另 一 方面 ， 道 德 伦理 上 的 不 确定 性 也 产生 了 令 人 不 塞 而 标的 结果 ， 这 
些 结果 阻碍 了 道德 伦理 以 及 一 些 重要 方面 的 研究 ， 这 一 事实 我 认为 还 不 太 
受 人 重视 。 辟 如， 在 2014 年 埃 博 拉 疫 情 暴发 期 间 ， 公 共 卫 生 当 局 希望 获取 
在 疫情 最 严重 的 相应 国家 的 人 群 迁移 信息 ， 从 而 帮助 控制 疾病 的 传播 。 移 
动 通信 公司 拥有 详细 的 通信 记录 ， 并 可 以 从 中 获取 相关 的 信息 。 然 而 ， 道 
德 伦 理 以 及 法 律 方面 的 担忧 使 研究 人 员 分 析 数 据 的 尝试 陷入 困境 

( Wesolowski et al. 2014; McDonald 2016 ) 。 如 果 我 们 作为 社 群 的 一 
员 ， 能 够 制定 研究 人 员 和 公众 共享 的 道德 伦理 规范 和 标准 ( 这 一 点 我 认为 
可 以 做 到 ) ， 那 么 我 们 就 可 以 用 一 种 对 社会 负责 和 有 益 的 方式 来 利用 数字 
时 代 赋 予 我 们 的 能 力 。 


一 个 阻碍 制定 该 共享 标准 的 因素 在 于 ， 社 会 科学 家 与 数据 科学 家 倾向 于 采 
用 不 同 的 方法 研究 道德 伦理 。 对 社会 科学 家 而 言 ， 道德 伦理 的 思考 由 机 构 
审查 委员 会 主导 ， 其 任务 在 于 执行 一 系列 的 法 规 。 毕 竟 ， 对 大 多 数 实证 社 
会 科学 家 来 说 ， 经 历 道德 伦理 辩论 的 唯一 途径 是 通过 官僚 机 构 审 查 委 员 会 
的 审查 过 程 。 数 据 科学 家 对 研究 道德 伦理 问题 仪 有 一 些 少 量 的 系统 性 经 
验 ， 因 为 对 计算 机 科学 与 工程 学 来 说 ， 这些 问题 并 不 是 受到 普遍 讨论 的 。 
无 论 是 社会 科学 家 在 乎 的 以 规则 为 基准 的 方法 ， 还 是 数据 科学 家 在 乎 的 以 
特例 假设 为 基准 的 方法 ， 两 者 在 数字 时 代 对 于 社会 研究 均 不 适用 。 取 而 代 
之 ， 我 相信 我 们 作为 社 群 的 一 员 ， 如 果 能 够 采取 一 种 基于 原则 的 方法 ， 就 
能 取得 进步 。 也 就 是 说 ， 研 究 人 员 应 该 用 现 有 的 规则 来 评估 他 们 的 研究 

( 如 果 有 的 话 ) ， 以 及 用 更 为 普遍 的 道德 伦理 原则 进行 评估 。 这 种 基于 原 
则 的 方法 能 帮助 研究 人 员 在 规则 不 适用 的 情况 下 做 出 理性 的 决定 ， 并 且 帮 
助 研究 人 员 将 他 们 的 推断 传达 给 他 人 和 公众 。 


我 所 提倡 的 这 种 基于 原则 的 方法 并 非 初创 。 它 借鉴 了 数 十 年 前 的 一 些 想 
法 ， 其 中 大 部 分 内 容 都 体现 在 两 个 具有 里 程 碑 意义 的 报告 中 : 《贝尔 蒙 报 
i) (Belmont Report) 与 《 门 罗 报告 》 (Menio Report), 。 你 将 看 到 ， 在 
一 些 事 例 中 ， 这 种 基于 原则 的 方法 能 引领 我 们 找到 清晰 有 效 的 解决 方法 。 


如 果 不 能 解决 这 些 问题 ， 它 将 阐明 所 涉及 的 需要 权衡 的 问题 ， 这 对 于 实现 
适当 的 平衡 至 天 重要 。 此 外 ， 基 于 原则 的 方法 具有 足够 的 共通 性 ， 无 论 你 
们 在 哪里 工作 〈 比如 大 学 、 政 府 机 天 、 非 政府 组 织 或 者 公司 ) ， 它 都 会 有 
所 帮助 。 


本 章 旨 在 帮助 善意 的 个 体 研究 人 员 。 对 于 工作 中 所 涉及 的 道德 伦理 问题 ， 
你 应 该 怎样 思考 ? 你 应 该 如 何 让 你 的 工作 更 加 符合 道德 伦理 ? 在 6.2 节 , 
我 将 介绍 三 个 在 数字 时 代 引 起 道德 伦理 争议 的 研究 项 目 。 接 着 在 6.3 节 

中 ， 我 会 将 这 些 具体 的 事例 抽象 化 ， 以 此 描述 产生 道德 伦理 不 确定 性 的 一 
些 基 本 原因 : 迅速 提高 的 研究 人 员 相 关 能 力 ， 使 得 他 们 在 未 经 参与 者 同意 
甚至 在 其 之 不 知情 的 情况 下 对 人 类 进行 观察 与 实验 。 这 种 能 力 的 改变 远 超 
我 们 的 规范 、 准 则 与 法 律 的 修订 速度 。 在 6.4 节 中 ， 我 将 描述 四 项 既 有 的 
原则 ， 以 便于 指导 你 的 思考 方向 : 对 他 人 的 尊重 原则 、 有 利 化 原则 、 公正 
原则 以 及 对 法 律 和 公共 利益 的 尊重 原则 。 接 下 来 ， 在 6.5 节 中 ， 我 会 总 结 
两 种 广泛 的 道德 框架 ， 即 结果 主义 与 义务 论 ， 它 们 可 以 帮助 你 解决 可 能 
临 的 更 深层 次 的 挑战 : 在 什么 样 的 时 机 适合 使 用 道德 上 存在 问题 的 手段 来 
达到 符合 道德 标准 的 目的 ? 这 些 原 则 和 道德 框架 在 图 6.1 中 得 以 归纳 ， 它 
们 将 使 你 超越 对 现 有 法 规 所 允许 的 范围 的 关注 ， 并 提高 你 与 其 他 研究 人 员 


和 公众 沟通 想法 的 能 力 。 
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图 6.1 支配 研究 的 规则 来 源 于 原则 ， 而 原则 相应 地 来 源 于 道德 框架 。 本 章 
的 一 个 主要 论点 在 于 研究 人 员 应 该 通过 现 有 的 规则 (如 果 有 的 话 ) 以 及 更 
为 一 般 的 道德 原则 评估 自己 的 研究 。《 通 则 》( 即 《 美 国联 邦 受 试 者 保护 
通则 》 ) 是 目前 支配 美国 大 部 分 联邦 资助 研究 的 一 系列 规定 ( 更 多 信息 参 
见 本 章 的 历史 附录 ) 。 这 四 项 原则 来 自 《 贝 尔 蒙 报告 》 和 《 门 罗 报 告 》 
(更 多 信息 参见 本 章 的 历史 附录 ) 。 最 后 ， 结 果 主 义 与 义务 论 作 为 两 种 道 
德 框 架 已 经 在 过 去 的 数 百 年 中 经 过 哲学 家 的 努力 得 以 发 展 。 有 一 个 简单 而 
粗略 的 方法 ， 可 以 用 来 区 分 这 两 种 框架 : 义务 论 专注 于 过 程 ， 结 果 主 义 专 
注 于 结果 。 


有 了 这 样 的 背景 ， 在 6.6 节 中 ， 我 将 讨论 对 数字 时 代 的 社会 研究 人 员 来 

说 ， 特 别 具 有 挑战 性 的 四 个 领域 : 知情 同意 ( 6.6.1 小 节 ) 、 理 解 与 管理 信 
息 化 风险 (6.6.2 小 节 ) 、 隐 私 权 ( 6.6.3 小 节 ) 以 及 面 对 不 确定 性 做 出 符 
合 伦理 规范 的 决策 (6.6.4 小 节 ) 。 在 6.7 节 ， 我 将 提供 在 不 稳定 的 伦理 领 
域 工作 环境 下 的 三 个 实用 技巧 。 本 章 最 后 是 一 个 历史 附录 ， 我 简要 总 结 了 
美国 道德 伦理 监督 研究 的 进展 ， 包 括 对 塔 斯 基 吉 梅 毒 实验 ( Tuskegee 
Syphilis Study ) 、《 贝 尔 蒙 报告 》、《 通 则 》 和 《 门 罗 报 告 》 的 讨论 。 


6.2 三 个 事例 


数字 时 代 的 社会 研究 将 涉及 一 些 理性 而 善意 的 人 不 会 同意 的 道德 伦理 情 
/ 见 。 


为 了 让 事情 具体 化 ， 我 将 从 三 个 引起 道德 伦理 争议 的 数字 时 代 研 究 项 目 开 
台 讲 起 。 我 选择 这 些 特别 的 研究 项 目 主 要 基于 两 个 理由 。 一 是 天 于 这 些 研 
究 均 没 有 简单 的 答案 。 也 就 是 说 ， 理 性 而 善意 的 人 们 在 这 些 研 究 是 否 应 该 
发 生 以 及 哪些 改变 可 能 改善 这 些 研究 项 目 方 面 意见 不 一 致 。 二 是 这 些 研 究 
体现 了 本 章 后 半 部 分 将 要 讨论 的 许多 原则 、 框 架 及 其 紧张 关系 。 


6.2.1 情绪 感染 项 目 


70 万 名 脸谱 网 用 户 被 放 入 一 项 实验 中 ， 这 可 能 改变 他 们 的 情绪 。 这 些 参 与 
者 并 没有 同意 参与 ， 该 研究 也 没有 受到 有 意义 的 第 三 方 伦理 监管 。 


2012 年 1 月 的 一 周 里 ， 大 约 70 万 名 脸谱 网 用 户 被 安置 进 一 个 名 为 情绪 感染 
的 实验 中 ， 即 研究 一 个 人 的 情绪 受到 与 其 互动 的 他 人 情绪 影响 程度 的 实 
验 。 我 已 经 在 第 4 章 中 讨论 过 这 个 实验 ， 但 是 我 现在 还 会 再 次 回顾 它 。 情 
绪 感 染 这 项 实验 中 的 参与 者 被 放 入 4 个 组 : “消极 减少 ?组 ， 即 在 新 消息 展 
示 中 对 那些 带 有 消极 词汇 (比如 “悲伤 ”) 的 帖子 进行 随机 屏蔽 ;“ 积 极 减 
少 ” 组 ， 即 对 那些 带 有 积极 词汇 (比如 “幸福 ”) 的 帖子 进行 随机 屏蔽 ; 以 及 
两 个 对 照 组 ， 一 个 对 应 “积极 减少 ?组 ， 另 一 个 对 应 “消极 减少 ”组 。 研 究 人 
员 发 现 ， 与 对 照 组 相 比 “积极 减少 ”组 的 人 使 用 的 积极 词汇 略 少 ， 而 消极 
词汇 略 多 。 相 似 地 ， 他 们 也 发 现 身 处 “消极 减少 ”组 的 人 使 用 积极 词汇 稍 

多 ， 消极 词汇 较 少 。 因 此 ， 研 究 人 员 得 出 了 情绪 感染 的 相应 证 据 
(Kramer, Guillory, and Hancock 2014 ) 。 更 完整 的 实验 设计 和 结果 的 讨 
论 ， 请 参见 第 4 章 。 


在 该 论文 通过 《美国 国家 科学 院 院 刊 》 发 表 后 ， 研 究 人 员 和 新 闻 媒 体 对 此 
表达 了 强烈 的 抗议 。 围 绕 该 论文 的 争议 主要 集中 在 以 下 两 点 : (1 ) 对 于 
超出 脸谱 网 标准 服务 条 款 规 则 的 部 分 ， 参 与 者 并 没有 提供 任何 的 同意 许 
可 ; (2) 该 研究 没有 经 过 有 效 的 第 三 方 伦理 审查 ( Grimmelmann 

2015 ) 。 日 渐 激 化 的 争议 中 所 反映 的 道德 伦理 问题 ， 使 该 期 刊 迅速 针对 此 
次 研究 发 表 了 一 篇 罕见 的 关于 道德 伦理 和 伦理 审查 过 程 的 社论 ( Verma 
2014 ) 。 在 随后 的 几 年 中 ， 这 项 实验 一 直 广 受 争议 并 引起 了 激烈 的 讨论 ， 
而 对 这 项 实验 的 批评 可 能 会 将 这 类 研究 引 向 地 下 实验 ， 造 成 意 想不到 的 后 
(Meyer 2014 ) 。 也 就 是 说 ， 有 些 人 认为 某 些 公司 并 没有 停止 这 类 实 
验 ， 只 是 停止 了 在 公众 面前 提 及 它们 。 无 论 如 何 ， 这 场 争议 可 能 有 助 于 促 


进 脸谱 网 伦理 研究 审查 流程 的 创建 (Hernandez and Seetharaman 2016; 
Jackman and Kanerva 2016 ) 。 


6.2.2“3T” 项 目 


研究 人 员 从 脸谱 网 上 搜 刊 学 生 的 数据 ， 将 其 与 大 学 记录 合并 ， 将 这 些 合并 
后 的 数据 用 于 研究 ， 然 后 与 其 他 研究 人 员 共享 。 


从 2006 年 开始 的 每 一 年 ， 一 个 由 教授 及 其 研究 助理 组 成 的 小 组 都 在 “美国 
东北 部 的 一 所 多 元 化 私立 大 学 ?中 搜刮 学 生 的 脸谱 网 资料 。 然 后 研究 人 员 
将 这 些 包 含 了 好 友信 息 与 文化 品位 的 脸谱 网 数据 与 包含 了 学 术 主 攻 方 向 和 
在 校园 内 居住 信息 的 校方 数据 进行 了 合并 。 这 些 合并 后 的 数据 是 非常 有 用 
的 资源 ， 通 过 这 些 数 据 ， 我 们 能 够 对 社交 网 络 是 如 何 形成 的 ( Wimmer 
and Lewis 2010 ) 以 及 社交 网 络 与 行为 是 如 何 共同 演变 的 (Lewis, 
Gonzalez and Kaufman 2012) 等 主题 产生 新 的 认识 。 除 了 将 这 些 数据 用 
于 他 们 自己 的 工作 之 外 ，“3T” 项 目 [ Tastes ( 文化 品位 ) Ties ( 关 

系 ) Time (时 间 ) ] 的 研究 人 员 在 采取 一 些 保护 学 生 隐 私 的 措施 后 ， 还 
将 这 些 数据 提供 给 了 其 他 研究 人 员 ( Lewis et al. 2008 ) 。 


不 幸 的 是 ， 在 提供 这 些 数 据 的 数 日 后 ， 其 他 研究 人 员 就 推断 出 这 所 学 校 是 
哈佛 大 学 (Zimmer 2010 ) 。 这 个 项 目的 研究 人 员 被 指责 为 “不 遵守 伦理 
研究 标准 ”, 部 分 原因 在 于 学 生 并 未 提供 知情 同意 ( 所 有 程序 均 经 过 哈佛 
机 构 审 查 委员 会 和 脸谱 网 审核 并 批准 ) 。 此 外 还 出 现 了 来 自学 术 机 构 、 媒 
体 的 批评 声 ， 比 如 标题 为 《哈佛 研究 人 员 被 控 侵 犯 学 生 隐 私 权 》 的 纸 媒 报 
道 (Parry 2011), 。 最 后 ， 这 些 数据 库 被 从 网 上 移 除 ， 并 且 不 再 能 提供 给 
其 他 研究 人 员 使 用 。 


6.2.3“Encore” 项 目 

研究 人 员 让 人 们 的 计算 机 秘密 地 去 访问 可 能 被 专制 政府 屏蔽 的 网 站 。 
2014 年 3 月 ， 山 姆 . 伯 内 特 (Sam Burnett ) 与 尼克 . 菲 姆 斯 特 (Nick 
Feamster ) 启动 了 “Encore”( 意 为 “再 次 ”) 项 目 ， 这 是 一 个 为 互联 网 审查 


提供 实时 和 全 球 测量 的 系统 。 要 做 到 这 一 点 ， 位 于 乔治 亚 理工 学 院 的 研究 
人 员 鼓 励 网 站 所 有 者 将 这 个 小 代码 片段 放 到 他 们 网 页 的 源 文件 中 : 


<iframe src="//encore.noise.gatech.edu/task.html" 
width="0" height="0" 


style="display: none"></iframe> 


如 果 你 访问 一 个 植 入 此 片段 代码 的 网 站 主页 ， 你 的 网 页 浏览 器 就 会 党 试 与 
网 站 进行 沟通 ， 以 使 研究 人 员 发 现 可 能 的 互联 网 审查 (比如 观察 你 是 否 访 
问 了 一 个 被 禁止 的 政治 党 派 的 网 站 ) 。 接 着 ， 你 的 网 页 浏览 器 将 会 反馈 给 
研究 人 员 ， 告 诉 他 们 它 是 否 能 够 与 可 能 受到 屏蔽 的 网 站 进行 沟通 (如 图 
6.2 ) 。 更 进一步 来 说 ， 所 有 的 步骤 都 不 可 见 ， 除 非 你 调用 网 页 的 源 文件 
进行 检查 。 这 种 隐形 的 第 三 方 页 面 请 求 在 网 络 上 非常 普遍 ( Narayanan 
and Zevenbergen 2015 ) ， 但 它们 很 少 涉及 明确 的 对 互联 网 审查 的 测量 。 


这 种 测量 互联 网 审查 制度 的 方法 有 一 些 非常 具有 吸引 力 的 技术 特性 。 如 果 
足够 多 的 网 站 都 植 入 了 这 样 简单 的 代码 片段 ， 那么 ‘Encore” 项 目 就 能 够 提 
供 对 被 审查 网 站 的 实时 化 、 全 球 化 测量 结果 。 在 启动 这 个 项 目 之 前 ， 研 究 
人 员 与 所 处 机 构 的 机 构 审 查 委 员 会 进行 了 交流 ， 而 该 机 构 审 查 委员 会 拒绝 
审查 该 项 目 ， 因 为 它 不 满足 《通则 》 《更 多 信息 请 参阅 本 章 历史 附录 ) 规 
定 下 的 “人 体 研 究 ” 条 款 。 


1. 面向 用 户 的 源 服务 页 面包 含 -| 
着 测量 任务 


2. 用 户 获取 页 面 并 执行 测量 任务 


用 户 


竹 务 向 测量 目标 上 的 资源 发 出 跨 源 请 求 


© 


测量 目标 


4. 审查 者 可 能 会 过 滤 请 求 或 做 出 回复 


图 6.2“Encore” 项 目的 研究 设计 示意 图 。 在 源 网 站 中 植 入 一 小 段 代码 片段 
(步骤 1 ) 。 你 的 计算 机 加 载 该 网 页 时 ， 随 之 启动 测量 任务 (步骤 2 ) 。 你 
的 计算 机 试图 访问 该 测量 目标 ， 也 就 是 访问 受到 屏蔽 的 政党 网 站 (步骤 

3 ) 。 政 府 审 查 互 联网 的 审查 者 在 接 下 来 可 能 会 对 你 向 测量 目标 的 访问 进 
行 屏蔽 (步骤 4 ) 。 最 终 你 的 计算 机 会 反馈 给 研究 人 员 相 应 的 请 求 结果 


(在 图 中 未 显示 ) 。 该 图 片 获 得 计算 机 协会 Burnett and 
Feamster (2015) 文中 图 1 的 转载 许可 。 


然而 ， 在 “Encore” 项 目 启动 后 不 久 ， 研 究 生 本 :汉文 贝 根 (Ben 
Zevenbergen ) 联系 了 该 项 目的 研究 人 员 ， 提 出 了 有 关 “Encore” 项 目 涉及 
道德 伦理 的 问题 。 特 别 是 ， 泽 文 贝 根 关注 那些 在 特定 国家 里 利用 他 们 的 计 
算 机 尝试 访问 某 些 敏感 网 站 的 人 人们， 他们 可 能 会 被 暴露 在 危险 情况 之 下 ， 
并 且 这 些 人 在 参与 这 个 研究 的 过 程 中 并 不 知情 。 基 于 这 些 对 

话 ，“Encore” 项 目 团队 修改 了 该 项 目的 运营 条 件 ， 试 图 仅 对 脸谱 网 、 推 特 
以 及 优 免 进行 测试 ， 因 为 在 正常 的 网 页 浏览 器 中 ， 第 三 方 试图 访问 这 些 网 
站 是 很 常见 的 ( Narayanan and Zevenbergen 2015). 


在 使 用 这 种 修改 后 的 设计 搜集 数据 后 ， 一 份 描述 其 算法 和 一 些 结果 的 论文 
被 提交 给 了 一 个 著名 的 计算 机 科学 会 议 ， 即 美国 计算 机 学 会 数据 通信 专业 
组 (SIGCOMM ) 。 该 项 目 委员 会 对 该 文献 的 技术 贡献 表示 赞赏 ， 但 对 其 
缺乏 参与 者 知情 同意 表示 担忧 。 随 后 ， 该 项 目 委员 会 决定 发 表 该 论文 ， 但 
也 随 之 附 上 一 份 对 道德 伦理 表示 关注 的 声明 ( Burnett and Feamster 
2015 ) 。 这 种 类 似 的 附属 声明 从 未 在 数据 通信 专业 组 会 议 上 被 使 用 过 ， 这 
个 事例 引发 了 计算 机 科学 家 对 他 们 的 研究 中 有 关 伦 理性 质问 题 的 讨论 


( Narayanan and Zevenbergen 2015; Jones and Feamster 2015 ) 。 


6.3 数字 时 代 的 不 同 
在 数字 时 代 进 行 的 社会 研究 有 许多 不 同 的 特性 ， 这 些 特性 带 来 了 不 同 的 道 


德 伦 理 问 题 。 


在 模拟 时 代 ， 绝 大 多 数 社会 研究 的 规模 相对 有 限 ， 它 们 在 一 系列 合理 而 明 
确 的 规则 下 运作 。 但 在 数字 时 代 ， 社 会 研究 的 情况 截然 不 同 。 研 究 人 员 通 
常 与 公司 或 政府 部 门 进行 紧密 的 合作 ， 相 比 于 过 去 ， 他 们 对 测试 参与 者 拥 
有 了 更 多 的 掌控 力 ， 而 对 这 些 力 量 的 使 用 并 没有 一 个 明确 的 规则 。 对 于 这 
种 能 力 ， 我 将 其 简单 地 视 作 在 未 经 人 们 知情 同意 甚至 在 其 没有 意识 的 情况 
下 进行 研究 活动 的 能 力 。 这 一 系列 的 活动 包括 研究 人 员 能 够 在 实验 中 观察 
人 们 并 控制 他 们 的 行为 。 随 着 研究 人 员 观 察 和 干预 能 力 的 增强 ， 对 如 何 使 
用 这 种 能 力 的 清晰 定义 却 并 没有 被 相应 界定 。 事 实 上 “， 研 究 人 员 必 须 基于 
一 些 前 后 矛盾 并 相互 重 寺 的 规则 、 法 律 和 规范 来 决定 如 何 行使 这 些 能 力 。 
强大 的 能 力 与 模糊 的 指导 方针 的 结合 造成 了 当下 困难 的 情况 。 


这 样 一 系列 能 力 中 的 一 项 ， 包 括 研究 人 员 现 在 可 以 未 经 参与 者 知情 同意 或 
者 在 他 们 没有 察觉 的 情况 下 观察 参与 者 的 行为 。 研 究 人 员 在 过 去 当然 也 可 
以 这 样 做 ， 但 是 在 数字 时 代 ， 这 种 规模 是 完全 不 同 的 ， 这 一 事实 已 经 被 许 
多 大 数据 热衷 者 反复 宣传 过 了 。 特别 是 ， 如 果 我 们 从 个 别 学 生 或 教授 的 研 
究 规 模 转移 到 公司 或 者 政府 部 门 层面 上 ， 比如 对 与 研究 人 员 合 作 日 益 紧 密 
的 机 构 来 说 ， 潜在 的 伦理 问题 就 变 得 复杂 起 来 。 我 认为 有 一 个 比喻 可 以 帮 
助人 们 全 面 了 解 这 种 大 规模 监视 的 想法 ， 那 就 是 全 景 监狱 

( Panopticon ) 。 全 景 监狱 是 最 初 由 杰 里 米 : 边 沁 (Jeremy Bentham ) 针 
对 监狱 而 提出 的 一 种 建筑 设计 ， 它 是 一 种 圆 形 建筑 ， 监 舍 是 围绕 着 中 央 卡 
望 塔 而 修建 的 ( 图 6.3 ) 。 监 狱 管理 者 能 够 在 瞳 望 塔 中 观察 所 有 在 监 内 犯 

的 行为 ， 而 监 舍 中 的 犯人 无 法 看 到 监视 人 员 。 身 处 瞳 望 塔 中 的 人 们 因此 被 
称 为 看 不 见 的 观察 者 ( Foucault 1995 ) 。 对 于 一 些 隐私 倡导 者 来 说 ， 数 

字 时 代 将 我 们 带 进 了 全 景 监狱 ， 因 为 科技 公司 与 政府 部 门 不 断 监视 并 记录 
我 们 的 行为 。 

[image] 

图 6.3 全 景 监狱 由 杰 里 米 : 边 沁 首 次 提出 。 居 中 处 有 一 名 看 不 见 的 观察 者 能 
够 监视 所 有 人 的 行为 ， 却 不 会 被 他 人 察觉 。 上 图 由 威 利 : 雷 瓦尔 利 ( Willey 


Reveley ) 于 1791 年 绘制 。 来 源 : 《 杰 里 米 : 边 沁 的 工作 》( The Works of 
Jeremy Bentham ) 一 书 。 


由 此 比喻 ， 我们 发 散 开 来 ， 许 多 社会 研究 人 员 认 为 ， 在 数字 时 代 ， 他 们 可 
以 想象 自己 是 身 处 中 心 上 望 塔 中 的 一 员 ， 观 察 人 们 的 行为 并 创建 一 个 主 数 


据 库 ， 进 行 各 种 各 样 让 人 激动 的 重要 研究 。 但 是 现在 ， 不 妨 设想 你 不 再 是 
身 处 中 心 瞳 望 塔 中 ， 而 是 身 处 其 中 一 个 监 舍 之 中 ， 那 么 这 个 主 数 据 库 就 开 
始 被 视 作 路 落 数据 库 [ 由 保罗 :欧姆 (Paul Ohm ) 在 2010 年 提出 ] ， 可 以 
用 于 不 道德 的 途径 。 


本 书 的 一 些 读者 足够 幸运 ， 能 生活 在 一 个 他 们 信任 其 看 不 见 的 观察 者 能 够 
负责 任 地 使 用 这 些 数 据 ， 并 且 面 对 敌人 能 够 保护 数据 的 国家 里 。 另 外 一 些 
读者 却 不 够 幸运 ， 并 且 我 确定 大 规模 监控 所 带 来 的 问题 对 他 们 来 说 是 非常 
明确 的 。 但 是 我 相信 对 那些 幸运 的 读者 来 说 ， 大 规模 监控 仍旧 会 带 来 一 个 
非常 值得 关注 的 问题 : 意料 之 外 的 二 次 使 用 。 也 就 是 说 ， 一 个 数据 库 是 出 

某 一 种 目的 而 建造 的 ， 比 如 发 送 定向 广告 ,但 有 一 天 它 也 可 能 被 用 于 一 
种 截然 不 同 的 目的 。 一 个 让 人 毛骨悚然 的 事例 ， 也 是 意料 之 外 的 二 次 使 
用 ， 发 生 在 第 二 次 世界 大 战 期 间 ， 当 时 政府 的 人 口 普 查 数据 被 用 来 促进 对 
犹太 人 、 罗 姆 人 和 其 他 一 些 人 种 的 种 族 灭 绝 ( Seltzer and Anderson 
2008 ) 。 这 些 在 和 平时 期 搜集 数据 的 统计 学 家 几乎 都 明确 地 拥有 良好 的 动 
机 ， 并 且 大 多 数 人 都 相信 他 们 能 够 负责 任 地 使 用 这 些 数据 。 但 是 ， 当 世道 
改变 的 时 候 ， 纳 粹 党 获得 权力 ， 这 些 数据 都 出 乎 意料 地 被 二 次 使 用 。 原 因 
很 简单 ， 一 旦 存在 主 数据 库 ， 就 很 难 意料 到 谁 可 以 访问 它 ， 以 及 如 何 使 用 
它 。 事 实 上 ， 威 廉 . 塞 尔 策 ( William Seltzer) 与 马 支 安德森 (Margo 
Anderson ) 2008 年 就 记录 了 18 项 人 口 统计 数据 涉及 或 可 能 涉及 侵犯 人 权 
的 案件 ( 表 6.1 ) 。 更 进一步 来 说 ， 正 如 塞 尔 策 与 安德森 提出 的 ， 这 份 列 
表 几 乎 可 以 肯定 只 是 保守 估计 ， 因 为 大 多 数 数 据 滥用 都 是 秘密 发 生 的 。 


普通 的 社会 研究 与 通过 二 次 使 用 侵犯 人 权 的 行为 相去 甚 远 。 尽 管 如 此 ， 我 
选择 讨论 这 项 议题 ， 是 因为 我 认为 它 有 助 于 你 们 理解 一 些 人 可 能 对 你 的 工 
作 作 何 反 应 。 让 我 们 回 到 “3T” 项 目 作 为 事例 。 通 过 将 来 自 脸谱 网 的 完整 精 
细 的 数据 与 哈佛 大 学 的 完整 精细 的 数据 合并 在 一 起 ， 研 究 人 员 对 学 生 的 社 
会 和 文化 生活 形成 了 惊人 的 丰富 观点 (Lewis et al. 2008 ) 。 对 许多 社会 
研究 人 员 来 说 ， 这 就 像 是 主 数据 库 ， 可 以 为 良好 的 目的 而 服务 。 但 是 对 其 
他 一 些 人 来 说 ， 这 也 可 以 让 它 成 为 一 个 姓 落 数据 库 ， 为 不 道德 的 目的 而 服 
务 。 事 实 上 ， 可 能 是 两 者 并 存 。 


除了 大 规模 监控 ， 研 究 人 员 通 过 再 次 与 公司 和 政府 部 门 合 作 ， 可 以 越 来 越 
多 地 干预 人 们 的 生活 ， 创 建 随机 对 照 实 验 。 比 如 ， 在 情绪 感染 项 目 中 ， 研 
究 人 员 在 未 取得 知情 同意 且 参 与 者 富 不 知情 的 情况 下 ， 在 实验 中 对 70 万 人 
进行 了 控制 。 正 如 我 在 第 4 章 所 描述 的 那样 ， 在 这 种 实验 中 ， 秘 密 被 征用 
的 参与 者 并 不 少见 ， 并 且 不 需要 大 公司 的 合作 。 事 实 上 ， 在 第 4 章 中 ,我 
已 经 指出 了 如 何 应 对 这 样 的 情况 。 


表 6.1 人 口 数 据 系统 涉及 或 可 能 涉及 侵犯 人 权 的 案例 


地 区 时 间 目标 个 体 或 群体 数据 系统 侵犯 人 权 或 推测 为 国家 意图 
澳 大 | 19 世纪 到 20 世 


| 
利 亚 | ay 原 住民 人 口 登记 强制 迁徙 、 种 族 灭绝 
法 国 |1940 一 1944 年 | 犹太 人 人 口 登 记 、 特 殊 人 口 普查 徙 、 种 族 灭绝 
德国 | 1933—1945 年 | 犹太 人 、 罗 姆 人 以 及 其 他 人 种 众多 措施 二、 种 族 灭 绝 
匈牙利 | 1945 一 1946 年 | 德国 国籍 以 及 以 德语 为 母语 的 人 群 | 1941 年 人 口 普查 om | 
荷兰 “| 1940 一 1944 年 | 犹太 人 和 罗 姆 人 人 口 登 记 系 统 HE, PAIR IR Ha | 
挪威 | 1845—1930 年 | 萨 米 人 和 克文 人 人 口 普查 | 
挪威 |1939 一 1944 年 | 犹太 人 特殊 人 口 普查 和 目的 性 人 口 登 记 | 
波兰 | 1939-1943 年 | 犹太 人 特殊 人 口 普查 | 
罗马 feces 
尼 亚 | 1941 一 1943 年 | 犹太 人 和 罗 姆 人 941 年 人 口 普查 种 族 灭 绝 | 
卢旺达 | 1994 年 图 西 族 AD Hid 
南非 |1950 一 1993 年 | 非洲 人 以 及 有 色 人 种 1951 年 人 口 普查 及 人 口 登记 剥夺 公民 选举 权 7 
美国 “| 19 世纪 美洲 原 住民 特殊 人 口 普查 、 人 口 登记 
| 美国 1917 年 法 律 草案 者 1910 年 人 口 普查 对 拒 的 人 进行 调查 和 起 诉 | 
美国 |1941—1945 年 | 日 裔 美国 人 1940 年 人 口 普 查 强制 迁徙 及 拘留 | 
美国 | 2001 一 2008 年 | REDEEM 家 教育 统计 中 心 调查 及 行政 数 | 国内 和 国际 恐怖 分 子 的 调查 与 起 诉 
美国 |2003 年 阿拉 伯 裔 美国 人 | 2000 年 人 口 普查 未 知 | 
ial 1919-1939 年 | 少数 民族 多 种 人 口 普查 强制 迁 徒 、 其 他 严重 的 惩罚 


注 : 此 表 基 于 塞 尔 策 与 安德森 2008 年 的 报告 所 做 ， 其 中 我 列 了 一 列子 项 
目 。 有 关 每 个 事例 和 纳入 标准 的 更 多 信息 ， 请 参见 Seltzer and 
Anderson (2008 ) 。 其 中 一 些 事例 涉及 数据 意料 之 外 的 二 次 使 用 ， 但 并 
非 全 部 如 此 。 


面 对 这 种 日 益 增强 的 能 力 ， 研 究 人 员 受 制 于 不 统一 和 相互 重合 的 规则 、 法 
律 和 规范 。 这 种 不 统一 性 的 一 个 来 源 就 是 数字 时 代 的 能 力 发 展 远 超过 规 
则 、 法 律 和 规范 的 修订 速度 。 辟 如 ，《 通 则 》 从 1981 年 以 来 就 没有 大 幅 修 
订 过 ， 并 且 最 近 的 一 项 试图 使 其 更 符合 现代 要 求 的 提议 需要 近 5 年 半 的 时 
间 才 能 完成 ( Jaschik 2017 ) 。 另 一 个 不 统一 性 的 来 源 就 是 ， 围 绕 着 隐私 
权 等 抽象 概念 的 规范 仍 在 被 研究 人 员 、 政 策 制 定 者 和 其 他 积极 分 子 激烈 讨 
论 。 如 果 在 这 一 领域 的 专家 都 不 能 够 达成 一 种 统一 意见 ， 那 么 我 们 就 不 应 
该 期 望 实证 研究 人 员 或 参与 者 去 做 这 些 。 第 三 个 ， 也 是 最 后 一 个 不 统一 性 
的 来 源 在 于 ， 数 字 时 代 的 研究 与 其 他 领域 或 环境 的 联系 更 为 紧密 ， 这 导致 
一 些 规范 和 规则 存在 潜在 的 重 亚 。 璧 如， 在 情绪 感染 项 目 中 ， 来 自 脸谱 网 
的 数据 科学 家 与 来 自 康 奈 尔 大 学 的 教授 和 研究 生 进行 紧密 合作 。 在 那 时 ， 
脸谱 网 进行 了 大 量 实验 却 没 有 第 三 方 监管 的 事实 是 普遍 的 ， 只 要 这 些 实验 
符合 脸谱 网 的 服务 条 款 即 可 。 对 康 奈 尔 大 学 来 说 ， 规 范 与 规则 就 截然 不 
同 : 几乎 所 有 的 实验 都 必须 在 康 奈 尔 大 学 机 构 审查 委员 会 的 监管 下 开展 。 
那么 ， 究 竟 应 该 采取 什么 样 的 规则 来 指导 情绪 感染 项 目 ， 是 听从 脸谱 网 的 
还 是 康 奈 尔 大 学 的 ? 当 这 些 都 不 统一 并 且 与 规则 、 法 律 和 规范 相互 重 蜀 
时 ， 充满 善 意 的 研究 人 员 也 可 能 遇 到 麻烦 。 事 实 上 ， 正 因为 这 样 的 不 统一 
性 ， 可 能 没有 一 件 事 是 完全 正确 的 。 


总 的 来 说 ， 这 两 项 特征 ， 即 能 力 的 增强 和 应 该 如 何 使 用 能 力 的 共识 的 缺 
乏 ， 都 意味 着 数字 时 代 的 研究 人 员 将 在 可 预见 的 未 来 面临 道德 伦理 的 挑 

战 。 幸 运 的 是 ， 在 处 理 这 些 挑战 时 ， 并 不 需要 从 头 开 始 。 相 反 ， 研 究 人 员 
可 以 从 以 前 制定 的 道德 原则 和 框架 中 吸取 智慧 。 我 将 在 下 面 两 节 中 讨论 这 


些 主题 。 


6.4 四 项 原则 


研究 人 员 面 对 道德 伦理 不 确定 性 时 ， 可 采取 的 四 项 原则 包括 : 对 人 的 尊重 
原则 、 有 利 化 原则 、 公 正 原则 、 对 法 律 和 公共 利益 的 尊重 原则 。 


数字 时 代 研 究 人 员 所 面 对 的 道德 伦理 挑战 与 以 往 截然 不 同 。 尽 管 如 此 ， 研 
究 人 员 还 是 可 以 通过 早期 构建 的 伦理 思想 来 应 对 这 些 挑战 。 特 别 是 我 相信 
《贝尔 蒙 报告 》 与 《 门 罗 报告 》 这 两 份 报 告 反 映 出 的 原则 可 以 帮助 研究 人 
员 推 断 出 他 们 面临 的 道德 挑战 。 正 如 我 在 本 章 的 历史 附录 中 详细 描述 的 那 
样 ， 这 两 份 报告 都 是 多 名 专家 组 成 的 小 组 经 过 多 年 审议 得 出 的 结果 ， 各 种 
利益 相关 者 提供 了 许多 参考 要 素 。 


首先 ， 在 1974 年 ， 为 回应 研究 人 员 的 伦理 过 失 ( 比如 臭名 昭著 的 塔 斯 基 吉 
梅毒 实验 ， 在 这 个 实验 里 ， 近 4 万 名 非洲 裔 美国 男性 被 研究 人 员 哄 骗 ， 并 
且 在 近 40 年 的 时 间 里 无 法 获得 安全 而 有 效 的 治疗 ) ， 美 国 国会 设立 了 一 个 
全 国 委员 会 ， 制 定 涉 及 人 体 研 究 的 伦理 准则 。 在 贝尔 蒙 会议 中 心 召 开会 议 
的 4 年 后 ， 该 委员 会 制定 了 《贝尔 蒙 报告 》， 这 是 一 份 页 数 不 多 却 分 量 十 
足 的 文件 。《 贝 尔 莹 报告》 是 《通则 》 的 知识 基础 ， 而 《通则 》 是 由 机 构 
审查 委员 会 强制 执行 的 一 系列 用 以 指导 以 人 类 为 对 象 的 科学 研究 的 规章 制 | 
度 (Porter and Koski 2008 ) 。 


接 下 来 ， 在 2010 年 ， 为 了 回应 计算 机 安全 领域 研究 人 员 的 伦理 过 失 ， 以 及 
弥补 在 数字 时 代 《 贝 尔 蒙 报告 》 观 点 应 用 的 局 限 性 ， 美 国政 府 ， 特 别 是 美 
国 国土 安全 部 ， 设 立 了 一 个 蓝 带 委员 会 ， 为 涉及 信息 通信 技术 的 研究 制定 
了 一 个 指导 性 的 道德 框架 。 这 项 努力 的 结果 就 是 《 门 罗 报 告 》 (Dittrich， 
Kenneally, and others 2011 ) 。 

《贝尔 蒙 报 告 》 和 《 门 罗 报 告 》 共 同 提供 了 四 条 可 以 指导 研究 人 员 进 行道 
德 伦 理 审查 的 原则 : 对 人 的 尊重 原则 、 有 利 化 原则 、 公 正 原 则 、 对 法 律 和 
公共 利益 的 尊重 原则 。 在 实践 中 应 用 这 四 项 原则 并 不 是 简单 直接 的 ， 人们 
可 能 需要 做 出 很 困难 的 平衡 。 尽 管 如 此 ， 这 些 原 则 仍 有 利于 权衡 利 浆 ， 提 
出 研究 设计 方面 的 改进 建议 ， 并 使 研究 人 员 能 够 向 彼此 和 公众 解释 缘由 。 


6.4.1 对 人 的 尊重 原则 
对 人 的 尊重 原则 在 于 将 人 视 作 独 立 自主 的 个 体 并 且 尊 重 他 们 的 愿望 。 


《贝尔 蒙 报告 》 认 为 ， 对 人 的 尊重 原则 由 两 个 不 同 的 部 分 组 成 : (1 ) 个 
体 应 该 被 视 作 独 立 自主 的 ，( 2 ) 缺少 独立 自主 权 的 个 体 应 该 有 权 获 得 额 


外 的 保护 。 独 立 自 主 ， 简 单 来 说 就 是 让 人 们 能 够 自行 掌控 他 们 自己 的 生 
活 。 换 名 话说， 对 人 的 尊重 原则 建议 研究 人 员 不 应 该 在 未 获得 同意 的 情况 
下 采取 行动 。 重 要 的 是 ， 即 使 研究 人 员 认 为 发 生 的 事情 是 无 害 的 ， 甚 至 是 
有 益 的 ， 也 应 该 遵守 对 人 的 尊重 原则 。 对 人 的 尊重 原则 要 求 让 参与 者 产生 
做 出 决定 的 想法 ， 而 不 是 由 研究 人 员 来 做 这 样 的 决定 。 


在 实践 中 ， 对 人 的 尊重 原则 被 解释 为 研究 人 员 应 该 尽 可 能 从 参与 者 那里 获 
得 知情 同意 。 知 情 同 意 的 基本 思想 是 ， 应 以 可 理解 的 形式 向 参与 者 提供 相 
关 信息 ， 然 后 使 其 自愿 同意 参与 其 中 。 这 些 相 关 信 息 的 每 一 个 术语 本 身 都 
是 大 量 额外 争议 和 学 问 的 主体 ( Manson and O’Neill 2007) ， 我 将 在 
6.6.1 小 节 中 阁 述 知情 同意 。 


在 本 章 开头 的 每 个 事例 中 ， 研 究 人 员 对 参与 者 都 采取 了 相应 的 行动 ， 

在 “3T” 项 目 中 使 用 参与 者 的 数据 ， 在 “Encore” 项 目 中 使 用 他 们 的 计算 机 对 
测量 任务 进行 评估 ， 在 情绪 感染 项 目 中 控制 他 们 的 行为 ， 这 些 均 没 有 获得 
或 无 视 了 参与 者 的 知情 同意 。 违 反对 人 的 尊重 原则 不 会 自动 使 这 些 研究 在 
道德 伦理 方面 遭 到 禁止 ， 对 人 的 尊重 原则 仅 是 四 项 原则 之 一 。 但 是 多 考虑 
一 些 尊重 他 人 的 方式 的 确 可 以 在 道德 伦理 上 改善 这 些 研究 。 例 如 ， 研究 人 
员 本 可 以 在 研究 开始 前 或 结束 后 从 参与 者 处 获得 某 种 形式 的 知情 同意 。 我 
在 6.6.1 小 节 中 讨论 知情 同意 时 ， 会 回顾 这 方面 的 项 目 。 


6.4.2 有 利 化 原则 


有 利 化 原则 在 于 理解 和 改善 研究 中 所 存在 的 风险 /收益 状况 ， 然 后 判断 研 
究 是 否 达到 正确 的 平衡 。 


《贝尔 蒙 报告 》 认 为 ， 遵 特有 利 化 原则 是 研究 人 员 对 参与 者 的 义务 ， 它 涉 
及 两 部 分 : (1 ) 不 伤害 ，( 2 ) 最 大 程度 保障 有 利 及 最 小 程度 造成 伤害 

( 如 果 无 法 避免 ) 。《 贝 尔 蒙 报告》 从 古 希 腊 医 学 家 希 波 克拉 底 在 传统 医 
学 伦理 中 的 “不 伤害 ”原则 中 获得 灵感 ， 并 且 以 一 种 强 有 力 的 形式 表达 出 研 
究 人 员 “ 不 应 该 伤害 一 个 人 ， 不管 这 可 能 会 给 别人 带 来 什么 好 

处 ”( Belmont Report 1979 ) 。 尽 管 如 此 ，《 贝 尔 蒙 报告 》 也 承认 ， 理 解 
这 可 能 给 别人 带 来 什么 好 处 的 过 程 本 身 也 许 会 让 某 些 人 暴露 在 风险 中 。 
此 ， 不 伤害 的 必要 性 可 能 与 理解 过 程 的 必要 性 相 冲 突 ， 导 致 研究 人 员 偶 尔 
要 做 出 艰难 的 决定 : “在 涉及 风险 的 情况 下 ， 何 时 我 们 可 以 理所当然 地 寻 
求 某 些 利益 ， 何 时 因 风 险 的 存在 我 们 应 该 放弃 相关 利益 ? ” 


在 实践 中 ， 有 利 化 原则 被 解释 为 研究 人 员 应 该 实施 两 个 不 同 的 步骤 : 风 
险 / 收 益 分 析 ， 以 及 随后 判定 风险 和 收益 是 否 达 到 适当 的 道德 伦理 平衡 。 
第 一 个 过 程 主要 涉及 实质 性 专业 知识 的 技术 问题 ， 而 第 二 个 过 程 主要 是 伦 
理 问 题 ， 在 第 二 个 过 程 里 ， 实质 性 专业 知识 可 能 不 那么 有 价值 ， 甚 至 是 有 


害 的 。 


风险 /收益 分 析 包 含 理解 与 改善 研究 中 的 风险 与 收益 。 对 风险 的 分 析 应 该 
包括 两 个 要 素 : 不 良 事件 发 生 的 概率 以 及 这 些 事件 的 严重 程度 。 作 为 风 
险 /收益 分 析 的 结果 ， 一 名 研究 人 员 可 以 调整 研究 的 设计 方案 ， 以 降低 不 
良 事件 发 生 的 概率 ( 比如 排除 心理 脆弱 的 参与 者 ) ， 或 者 在 其 发 生 后 减轻 
事件 的 严重 程度 ( 比如 向 有 需求 的 参与 者 提供 咨询 服务 ) 。 再 者 ， 在 风 
险 /收益 分 析 的 过 程 中 ， 研 究 人 员 需 要 明确 ， 他 们 的 研究 所 产生 的 影响 不 
仅 限 于 参与 者 ， 也 包括 非 参与 者 和 社会 公众 。 璧 如， 请 想 想 雷 斯 蒂 沃 与 范 
德里 杰 特 关于 奖励 对 维基 百科 编辑 的 影响 实验 ( 在 第 4 章 讨论 过 ) 。 在 这 
个 实验 中 ， 研 究 人 员 对 一 小 部 分 他 们 认为 有 价值 的 编辑 给 予 一 些 奖 励 ， 然 
后 追踪 这 些 人 之 后 对 维基 百科 的 贡献 ， 与 之 对 照 的 是 另 一 部 分 同样 值得 奖 
励 的 编辑 ， 但 研究 人 员 没 有 给 予 奖励 。 试 想 一 下 ， 如 果 不 是 仅 对 一 小 部 分 
人 提供 奖励 ， 而 是 对 维基 百科 的 编辑 均 提 供 非 常 多 的 奖励 会 是 什么 样 的 ? 
尽管 这 样 的 设计 并 不 会 伤害 任何 一 位 参与 者 ， 但 是 它 可 能 破坏 整个 维基 百 
科 的 系统 奖励 机 制 。 换 名 话说 ， 当 进行 风险 /收益 分 析 时 ， 你 不 仅 应 该 思 
考 你 的 工作 对 参与 者 的 影响 ， 而 且 应 该 把 整个 世界 都 更 多 地 考虑 进来 。 


接 下 来 ， 一 旦 风险 被 最 小 化 ， 利 益 被 最 大 化 后 ， 研 究 人 员 就 应 该 评估 研究 
是 否 能 够 带 来 一 个 良好 的 平衡 。 伦 理学 家 并 不 建议 单纯 地 计算 成 本 与 收 
益 。 特 别 是 ， 某 些 风险 会 致使 研究 不 被 允许 做 实验 ， 无 论 其 收益 有 多 高 

( 比如 在 历史 附录 中 涉及 的 塔 斯 基 吉 梅 毒 实 验 ) 。 与 技术 性 的 风险 /收益 
分 析 不 同 ， 第 二 个 步骤 需要 非常 符合 道德 标准 ， 事 实 上 可 以 由 没有 特定 专 
业 领 域 和 专业 知识 的 人 来 实施 。 事 实 上 ， 局 外 人 往往 相 较 于 局 内 人 更 能 够 
注意 到 各 种 不 同事 件 ， 这 就 是 在 美国 的 机 构 审 查 委 员 会 中 至 少 需 要 一 位 非 
研究 人 员 参 与 的 原因 。 在 我 服务 机 构 审查 委员 会 的 经 历 中 ， 这 些 局 外 人 能 
帮助 我 们 防止 从 众 思考 。 因 此 ， 如 果 你 在 研究 项 目 中 对 是 否 适当 进行 了 风 
险 / 收 益 分 析 感 到 疑惑 ， 那 么 别 去 询问 你 的 同事 ， 试 着 去 请 教 一 下 非 研究 
人 员 的 意见 ， 他 们 的 答案 可 能 会 让 你 感到 意外 。 


在 我 们 分 析 的 三 个 事例 中 ， 应 用 有 利 化 原则 可 能 会 改善 其 风险 /收益 的 平 
衡 。 辟 如， 在 情绪 感染 项 目 中 ， 研 究 人 员 本 可 以 尝试 排除 18 周 餐 以 下 的 用 
户 以 及 对 这 项 措施 反应 特别 过 激 的 用 户 。 他 们 本 可 以 通过 一 些 有 效 的 统计 
学 方法 尽量 减少 参与 者 的 人 数 (具体 细节 在 第 4 章 中 已 经 讨论 到 ) 。 再 

者 ， 他 们 本 可 以 试图 监控 参与 者 ， 并 向 似乎 受到 伤害 的 人 提供 帮助 。 

在 “3T” 项 目 中 ， 研 究 人 员 本 可 以 在 他 们 公开 数据 时 附带 特别 保护 措施 ( 尽 
管 他 们 的 程序 得 到 了 哈佛 机 构 审 查 委 员 会 的 批准 ， 而 这 一 批准 表明 在 当时 
这 样 做 是 符合 常规 做 法 的 ) ; 我 在 6.6.2 小 节 中 描述 信息 化 风险 时 ， 会 提供 
一 些 更 详细 的 有 关 数 据 公开 的 建议 。 最 后 ， 在 “Encore” 项 目 中 ， 研 究 人 员 
本 可 以 尽量 减少 为 实现 测量 目标 而 创建 的 风险 请 求 的 数量 ， 并 且 他 们 本 可 


以 排除 受到 专制 政府 威胁 最 大 的 参与 者 。 每 一 项 可 能 的 改变 均 需 要 这 些 项 
目的 设计 做 出 一 些 取舍 ， 我 的 目的 不 在 于 建议 研究 人 员 做 出 这 些 改变 ， 而 
在 于 更 多 地 展示 有 利 化 原则 能 够 带 来 的 改变 。 


最 后 ， 虽 然 数字 时 代 通 常 使 风险 和 收益 的 平衡 更 加 复杂 ， 但 它 也 使 研究 人 
员 更 容易 增加 其 工作 的 收益 。 特 别 是 ， 数 字 时 代 的 工具 极 大 地 促进 了 开放 
和 可 重复 研究 ， 研 究 人 员 可 以 将 他 们 的 研究 数据 和 代码 提供 给 其 他 研究 人 
员 ， 并 通过 公开 发 表 向 公众 提供 他 们 的 论文 结果 。 开 放 和 可 重复 研究 的 这 
种 趋势 绝 非 简单 的 变化 ， 它 为 研究 人 员 提 供 了 一 种 增加 研究 收益 的 途径 ， 
而 不 会 使 参与 者 面临 任何 额外 的 风险 (数据 共享 是 一 个 例外 情况 ， 我 将 在 
6.6.2 小 节 中 详细 讨论 信息 化 风险 ) 。 


6.4.3 公正 原则 
公正 原则 是 确保 研究 的 风险 和 收益 能 够 被 公平 地 分 配 。 


《贝尔 蒙 报告 》 认 为 ， 公 正 原则 涉及 分 配 研究 产生 的 风险 与 收益 。 即 在 社 
会 环境 中 不 应 该 仅 由 某 一 个 小 组 承担 研究 成 本 ， 而 另 一 个 小 组 获得 其 产生 
的 全 部 利益 ， 和 譬如 ，19 世 纪 到 20 世 纪 初 ， 在 医学 实验 中 担任 研究 对 象 的 负 
担 主要 落 在 穷人 身上 ， 而 因此 获得 更 好 的 医疗 保健 的 好 处 则 主要 流向 了 富 
人 。 


在 实践 中 ， 公 正 原则 最 初 被 解释 为 弱势 群体 应 该 被 保护 ， 免 受 研 究 人 员 的 
伤害 。 换 句 话 说， 研究 人 员 不 应 该 被 允许 故意 地 侵犯 弱势 群体 。 令 人 不 安 
的 是 ， 在 过 去 ， 大 量 存在 道德 伦理 问题 的 研究 通常 都 会 涉及 弱势 群体 ， 包 
括 缺 乏 教育 的 和 被 袜 夺 公 权 的 公民 (Jones 1993 ) 、 因 犯 ( Spitz 2005 ) 
以 及 住院 的 老 弱 患者 (Arras 2008), 


尽管 如 此 ， 大 约 在 1990 年 ， 对 公正 的 看 法 开始 从 保护 转向 接受 
(Mastroinanni and Kahn 2001), BY, 积极 分 子 认为 ， 儿童、 妇女 和 
少数 民族 需要 明确 纳入 临床 试验 之 中 ， 以 便 这 些 群 体 可 以 从 临床 试验 获得 
的 知识 中 受益 ( Epstein 2009 ) 。 


除了 关于 保护 与 接受 的 问题 之 外 ， 公 正 原则 还 经 常 引发 对 参与 者 的 适当 补 
偿 的 问题 ， 这 也 是 在 医学 伦理 方面 存在 激烈 争议 的 问题 (Dickert and 
Grady 2008 ) 。 


把 公正 原则 应 用 到 我 们 的 三 个 事例 中 ， 这 为 我 们 提供 了 不 同 的 方式 去 审视 
它们 。 这 些 研究 中 没有 任何 一 个 向 参与 者 提供 了 经 济 补偿 。“Encore” 项 目 
引起 了 最 为 复杂 的 公正 原则 问题 。 尽 管 有 利 化 原则 可 能 建议 排除 来 自 专制 
政府 国家 的 参与 者 ， 但 公正 原则 可 能 主张 让 这 些 人 参与 进来 并 从 中 获 益 ， 


以 此 来 准确 测量 互联 网 审查 制度 。“3T” 项 目 也 引发 了 争议 ， 因 为 仅 有 一 组 
学 生 承 担 了 研究 的 负担 ， 而 整个 社会 从 中 受益 。 最 后 ， 在 情绪 感染 项 目 
中 ， 承 担 研究 负担 的 参与 者 是 最 可 能 从 结果 中 受益 的 人 口 随机 样本 ( 即 脸 
谱 网 用 户 ) 。 从 这 个 意义 讲 ， 情 绪 感 染 项 目的 设计 与 公正 原则 是 非常 一 致 
的 。 


6.4.4 对 法 律 和 公共 利益 的 尊重 原则 


对 法 律 和 公共 利益 的 尊重 原则 ， 将 有 利 化 原则 从 具体 的 研究 参与 者 延伸 到 
了 整个 利益 相关 者 群体 。 


第 4 个 也 是 最 后 一 个 指导 我 们 思考 的 原则 就 是 对 法 律 和 公共 利益 的 尊重 原 
则 。 这 项 原则 来 源 于 《 门 罗 报 告 》， 因 此 并 不 为 广大 社会 研究 人 员 所 知 。 
《 门 罗 报告 》 认 为 ， 对 法 律 和 公共 利益 的 尊重 原则 隐 含 在 有 利 化 原则 之 
中 ， 但 它 也 认为 前 者 值得 被 明确 考虑 。 特 别 是 ， 当 有 利 化 原则 趋 于 关注 参 
与 者 时 ， 对 法 律 和 公共 利益 的 尊重 原则 明确 鼓励 研究 人 员 应 该 有 更 为 广阔 
的 想法 和 法 律 方面 的 考量 。 


在 《 门 罗 报 告 》 中 ， 对 法 律 和 公共 利益 的 尊重 原则 包含 两 个 明确 的 部 分 : 
(1) 合 规 性 ，( 2 ) 基于 透明 的 问 责 制 。 合 规 性 意味 着 研究 人 员 应 该 党 试 
识别 并 遵守 相关 法 律 、 合 同和 服务 条 款 。 例 如 ， 合 规 性 意味 着 ， 想 要 获取 
网 站 内 容 的 研究 人 员 应 该 阅读 并 考虑 该 网 站 的 服务 条 款 协 议 。 尽 管 如 此 ， 
也 有 可 能 存在 违反 服务 条 款 的 情况 ; 请 记 住 ， 对 法 律 和 公共 利益 的 尊重 原 
则 仅 是 四 项 基本 原则 之 一 。 警 如 ， 威 瑞 森 电信 ( Verizon) 与 AT&T ( 美国 
电话 电报 公司 ) 曾 一 度 有 服务 条 款 阻止 客户 对 其 进行 批评 ( Vaccaro et al. 
2015 ) 。 我 认为 研究 人 员 应 该 遵从 服务 条 款 。 在 理想 情况 下 ， 如 果 研 究 人 
员 违 背 了 服务 条 款 协议 ， 那 么 他 们 应 该 公开 解释 这 样 做 的 理由 ( 参见 
Soeller et al. 2016 ) ， 正 如 基于 透明 的 问 责 制 所 建议 的 那样 。 但 是 这 样 的 
公开 化 可 能 将 研究 人 员 暴 露 在 附加 的 法 律 风 险 下 ， 辟 如， 美国 《计算 机 欺 
诈 和 小 用法》( CFAA ) 可 能 将 违反 服务 条 款 定义 为 非法 (Sandvig and 
Karahalios 2016; Krafft, Macy, and Pentland 2016 ) 。 这 个 简短 的 讨论 表 
明 ， 伦 理 审 议 中 的 合 规 性 可 能 引发 更 为 复杂 的 问题 。 


除了 合 规 性 以 外 ， 对 法 律 和 公共 利益 的 尊重 原则 也 鼓励 基于 透明 的 问 责 
制 ， 这 意味 着 研究 人 员 应 该 对 各 阶段 的 研究 目标 、 方 法 以 及 结果 都 很 明 
确 ， 并 且 对 其 行为 负责 。 从 另 一 个 角度 来 想 ， 基 于 透明 的 问 责 制 试图 禁止 
研究 团体 的 秘密 行为 。 这 种 基于 透明 的 问 责 制 使 公众 在 道德 伦理 争议 中 发 
挥 了 更 广泛 的 作用 ， 这 对 伦理 和 实践 两 方面 都 很 重要 。 


将 对 法 律 和 公共 利益 的 尊重 原则 应 用 于 这 里 所 考虑 的 三 项 研究 中 ， 可 以 说 
明 研 究 人 员 在 涉及 法 律 时 所 面临 的 问题 的 复杂 性 。 警 如， 格林 默 曼 指 出 情 


绪 感 染 项 目 在 马里 兰州 可 能 是 非法 的 〈Grimmelmann 2015), ABE 
2002 年 马里 兰州 议会 通过 了 917 法 案 ( Maryland House Bill 917 ) ,将 
《通则 》 保 护 拓展 到 在 马里 兰州 进行 的 所 有 研究 ， 并 且 这 种 保护 与 研究 的 
资金 来 源 无 关 (很 多 专家 认为 情绪 感染 项 目的 主体 并 不 是 属于 联邦 法 律 
《通则 》 下 的 主体 ， 因 为 该 项 目 由 脸谱 网 发 起 ， 而 该 机 构 并 不 受到 美国 政 
府 的 研究 资助 ) 。 尽 管 如 此 ， 一 些 学 者 认为 马里 兰州 917 法 案 本 身 也 属 违 
3 ( Grimmelmann 2015, pp.237-238 ) 。 社 会 研究 人 员 并 非法 官 ， 因 此 
他 们 也 不 必 理 解 或 评估 全 美国 50 个 联邦 州 的 法 律 是 否 符合 完 法 。 在 国际 项 
目 中 ， 这 样 的 复杂 性 变 得 更 加 严重 。 辟 如 “Encore” 项 目 涉及 170 个 国家 的 
参与 者 ， 要 从 合 规 性 的 角度 考虑 是 异常 困难 的 。 为 了 回应 模糊 的 合法 环 
境 ， 研 究 人 员 可 能 通过 第 三 方 监管 其 工作 来 获 益 ， 以 防 研究 中 的 无 意 违 
法 ， 第 三 方 既是 法 律 要 求 的 建议 来 源 ， 也 是 对 个 人 的 保护 。 


另 一 方面 ， 这 三 项 研究 均 将 其 结果 发 表 于 学 术 期 刊 ， 以 实现 基于 透明 的 问 
责 制 。 事 实 上 ， 情 绪 感 染 项 目的 结果 以 公开 的 形式 发 表 ， 所 以 研究 机 构 或 
者 社会 大 众 能 够 获知 其 设计 方案 和 研究 结果 。 一 个 简单 而 粗略 的 用 来 评估 
基于 透明 的 问 责 制 的 方法 是 询问 你 自己 : 当 我 的 研究 过 程 在 我 家 乡 的 报纸 
头 版 上 被 提 及 时 ， 我 是 否 感到 心安 ? 如 果 答 案 是 否定 的 ， 那 么 就 说 明 你 的 
研究 设计 可 能 需要 做 出 调整 。 


总 而 言 之 , 《贝尔 蒙 报 告 》 和 《 门 罗 报告 》 提 出 了 四 项 可 用 于 评估 科学 研 
究 的 原则 : 对 人 的 尊重 原则 、 有 利 化 原则 、 公 正 原则 以 及 对 法 律 和 公共 利 
益 的 尊重 原则 。 应 用 这 四 项 原则 在 实践 中 并 不 是 简单 直 白 的 ， 它 可 能 需要 
更 为 复杂 的 权衡 。 和 譬如， 在 决定 是 否 向 情绪 感染 项 目的 参与 者 汇报 该 项 目 
的 情况 时 ， 对 人 的 尊重 原则 就 会 鼓励 研究 人 员 告 知 ， 但 是 有 利 化 原则 就 不 
会 鼓励 这 样 做 ( 如 果 汇 报 本 身 可 能 造成 伤害 的 话 ) 。 并 不 存在 一 种 自动 的 
方式 可 以 权衡 相互 冲突 的 原则 ， 但 是 这 四 项 原则 帮助 我 们 理解 了 如 何 做 出 
取舍 ， 对 研究 设计 方案 的 调整 给 出 了 建议 ， 还 能 让 研究 人 员 对 他 人 和 社会 
公众 解释 其 缘由 。 


6.5 两 种 道德 框 染 


大 多 数 关 于 实验 研究 的 道德 伦理 的 争议 都 会 减少 结果 主义 与 义务 论 之 间 的 
分 歧 。 


对 人 的 尊重 原则 、 有 利 化 原则 、 公 正 原则 以 及 对 法 律 和 公共 利益 的 尊重 原 
则 这 四 项 原则 本 身 来 源 于 更 为 抽象 的 两 种 道德 框架 : 结果 主义 与 义务 论 。 
理解 这 两 种 框架 有 所 神 益 ， 因 为 它们 将 可 以 让 你 识别 并 推断 出 伦理 研究 中 
最 根本 的 紧张 关系 之 一 : 使 用 潜在 的 不 道德 手段 达到 道德 目的 。 


结果 主义 来 源 于 杰 里 米 : 边 沁 与 约翰 - 穆 勒 (John Stuart Mill) HBR, XK 
注 于 采取 相关 行动 使 世界 上 的 国家 变 得 更 好 (Sinnott-Armstrong 

2014 ) 。 有 利 化 原则 旨 在 权衡 风险 和 利益 ， 是 结果 主义 者 更 为 深层 次 的 思 
考 来 源 。 义 务 论 来 源 于 康德 的 思想 ， 关 注 于 道德 义务 ， 它 与 其 所 收 到 的 结 
果 无 关 ( Alexander and Moore 2015 ) 。 对 人 的 尊重 原则 重视 参与 者 的 自 
主权 利 ， 它 是 一 种 道德 义务 的 深层 思考 来 源 。 一 个 简单 而 粗略 的 用 以 区 分 
这 两 种 框架 的 方法 是 : 道德 义务 论 者 关心 过 程 ， 而 结果 主义 者 关心 结果 。 


要 了 解 这 两 种 框架 如 何 运作 ， 可 以 参考 知情 同意 。 这 两 个 框架 均 能 用 以 支 
持 知情 同意 ， 但 是 有 不 同 的 理由 。 结 果 主 义 者 的 论证 观点 在 于 ， 对 于 禁止 
那些 不 能 准确 权衡 风险 与 预期 利益 的 研究 ， 知 情 同意 能 保护 参与 者 免 受伤 
害 。 换 言 之 ， 结 果 主 义 者 认为 支持 知情 同意 能 帮助 参与 者 免 受 不 良 结 果 的 
影响 。 尽 管 如 此 ， 对 义务 论 者 来 说 ， 其 论证 观点 在 于 ， 知 情 同意 关注 研究 
人 员 有 义务 尊重 参与 者 的 自主 决定 。 基 于 这 些 方法 ， 纯 粹 的 结果 主义 者 可 
能 愿意 在 没有 风险 的 情况 下 放弃 获得 知情 同意 的 要 求 ， 而 纯粹 的 道德 义务 
论 者 可 能 不 会 。 


结果 主义 和 义务 论 都 提供 了 重要 的 道德 洞察 力 ， 但 每 个 都 可 以 被 视 为 荒 廖 
的 极端 。 对 于 结果 主义 ， 其 中 一 个 极端 例子 是 移植 。 试 想 一 个 医生 有 5 名 
因 器 官 衰竭 而 濒临 死亡 的 病 患 ， 而 另外 一 个 人 的 器 官 可 以 拯救 这 5 个 人 。 
在 确定 的 条 件 下 ， 一 名 结果 主义 的 医生 会 允许 甚至 要 求 杀 死 那 位 健康 的 人 
去 获取 他 的 器 官 。 他 完全 只 看 结果 ， 并 不 考虑 过 程 ， 这 是 有 缺陷 的 。 


同 理 ， 义 务 论 也 一 样 拥有 荒唐 的 极端 ， 例 如 一 个 关于 定时 炸弹 的 例子 。 试 
想 一 个 警察 抓 捕 到 一 名 恐怖 分 子 ， 恐 怖 分 子 知道 一 枚 能 危及 数 百 万 人 生命 
的 定时 炸弹 的 位 置 。 一 个 信奉 义务 论 的 警察 可 能 不 会 通过 欺骗 来 从 恐怖 分 
子 口中 获知 定时 炸弹 的 位 置 。 他 完全 只 看 过 程 ， 并 不 考虑 结果 ， 也 一 样 是 
有 缺陷 的 。 
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到 ， 这 两 种 道德 框架 的 融合 可 以 帮助 我 们 理解 为 什么 存在 如 此 多 的 伦理 争 
议 ， 因 为 某 些 人 更 趋 近 于 结果 主义 者 而 另 一 些 人 更 趋 近 于 义务 论 者 ， 且 双 
方 无 法 取得 更 多 的 进展 。 结 果 主 义 者 往往 提出 有 关 结 果 的 论点 ， 而 这 样 的 
论点 并 不 被 义务 论 者 所 接受 ， 他 们 更 忧心 于 过 程 。 同 理 ， 义 务 论 者 倾向 于 
提供 有 关 过 程 的 论点 ， 而 这 也 不 被 结果 主义 者 所 接受 ， 他 们 更 关注 结果 。 
结果 主义 者 与 义务 论 者 就 此 渐 行 渐 远 。 


这 种 争议 的 一 个 解决 方案 是 让 社会 研究 人 员 发 展 出 一 种 一 致 的 、 道 德 坚实 
的 、 易 于 操作 的 结果 主义 与 义务 论 的 融合 体 。 很 遗憾 ， 这 不 太 可 能 发 生 ， 
哲学 家 已 经 被 这 个 问题 困扰 了 很 长 一 段 时 间 。 尽 管 如 此 ， 研 究 人 员 仍旧 能 
够 使 用 这 两 种 框架 以 及 四 项 原则 ， 为 道德 伦理 挑战 提供 理由 ， 明 确 利 次 权 
衡 以 及 改善 研究 设计 方案 。 


6.6 ADE 


四 项 原则 ， 即 对 人 的 尊重 原则 、 有 利 化 原则 、 公 正 原则 以 及 对 法 律 和 公共 
利益 的 尊重 原则 ; 两 种 道德 框架 ， 即 结果 主义 与 义务 论 ， 这 些 应 该 能 帮助 
你 厘清 任何 研究 中 所 面临 的 道德 伦理 问题 。 尽 管 如 此 ， 基 于 在 本 章 之 前 描 
述 的 数字 时 代 研 究 特 性 以 及 我 们 迄今 已 考虑 到 的 伦理 争议 ， 我 认为 存在 四 
个 特定 的 困难 面 : 知情 同意 、 理 解 与 管理 信息 化 风险 、 隐 私 权 以 及 面 对 不 
确定 性 所 做 出 的 决策 。 在 接 下 来 的 几 个 小 节 中 ， 我 将 描述 这 四 项 要 点 的 具 
体内 容 并 提供 如 何 处 理 它们 的 一 些 建议 。 


6.6.1 知情 同意 


\N 


研究 人 员 应 该 、 可 以 并 且 需 要 遵循 如 下 规则 : 在 大 多 数 研究 中 获得 某 种 开 
式 的 同意 。 


知情 同意 是 研究 道德 伦理 方面 的 一 个 基本 想法 ， 有 些 人 可 能 说 这 是 一 种 近 
乎 强迫 的 想法 ( Emanuiel, Wendler, and Grady 2000; Manson and 
O’Neill 2007 ) 。 最 简单 的 伦理 研究 要 求 : 所 有 事情 都 需要 知情 同意 。 尽 
管 如 此 ， 这 个 简单 的 规则 对 于 既 有 的 道德 原则 、 道德 规则 或 是 研究 方法 都 
不 一 致 。 取 而 代 之 ， 研 究 人 员 应 该 、 可 以 并 且 需 要 遵循 更 为 复杂 的 规则 : 
在 大 多 数 研 究 中 获得 某 种 形式 的 同意 。 


首先 ， 为 了 跳出 天 于 知情 同意 的 过 分 简单 化 的 想法 ， 我 想 告诉 你 更 多 关于 
研究 歧视 的 实地 调查 。 在 这 些 研 究 中 ， 虚 假 申 请 人 具有 不 同 的 特征 ， 比 如 
一 些 男 性 和 一 些 女 性 申请 不 同 的 工作 。 如 果 其 中 一 类 申请 者 更 频繁 地 受 
雇 ， 那 么 研究 人 员 可 以 归纳 认为 雇佣 过 程 中 可 能 存在 歧视 。 对 于 本 章 的 目 
的 来 说 ， 实 验 最 重要 的 事情 在 于 参与 者 ， 即 雇主 ， 在 实验 的 过 程 中 从 没有 
同意 参与 实验 。 事 实 上 ， 这 些 参与 者 都 被 积极 地 欺骗 了 。 然 而 ， 在 17 个 国 
家 进行 的 这 种 研究 歧视 的 实地 调查 有 117 项 之 多 (Riach and Rich 2002; 
Rich 2014 ) 。 


采用 实地 调查 研究 歧视 的 研究 人 员 已 经 确定 了 这 些 研 究 的 四 项 特征 ， 总 体 
而 言 ， 使 其 符合 道德 标准 : (1) 对 雇主 有 限 的 伤害 (2) 拥有 可 靠 的 歧 
视 衡 量 措施 ， 进 而 可 获取 巨大 的 社会 效益 ; (3) 衡量 歧视 的 其 他 方法 有 

其 自身 弱点 (4) 欺骗 行为 并 没有 严重 违反 规定 的 形式 ( Riach and Rich 
2004 ) 。 其 中 每 一 项 条 件 都 是 关键 的 ， 一 旦 其 中 一 条 不 被 满足 ， 那 么 这 个 
伦理 事例 将 面临 更 多 挑战 。 其 中 三 项 特征 来 源 于 《贝尔 蒙 报告 》 涉 及 的 道 
德 原 则 : 有 限 伤害 ( 对 人 的 尊重 原则 、 有 利 化 原则 ) ， 获 取 最 大 利益 ， 相 
较 而 言 其 他 方法 有 其 不 足 ( 有 利 化 原则 、 公 正 原则 ) 。 最 后 一 项 特征 ， 遵 
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则 。 换 言 之 ， 就 业 申 请 其 本 身 是 一 个 已 存在 一 些 可 预期 欺骗 的 环境 。 
此 ， 这 些 实验 并 不 会 侵犯 既 有 的 原始 道德 观 。 


除了 这 种 基于 原则 的 论点 之 外 ， 多 数 机 构 审 查 委 员 会 认为 ， 这 些 研究 虽然 
缺乏 知情 同意 ， 但 与 现 有 规则 还 是 相 一 致 的 ， 特 别 是 与 《通则 》 第 46 章 
116 条 d 部 分 中 所 描述 的 相 一 致 。 最 后 ， 美 国法 院 也 支持 在 实地 调查 中 缺乏 
同意 和 使 用 欺骗 来 衡量 歧视 的 行为 (No. 81-3029. United States Court of 
Appeals, Seventh Circuit). 。 因 此 ， 在 未 经 同意 的 情况 下 进行 实地 调查 符 
合 既 有 的 道德 原则 与 规则 ( 至 少 符合 在 美国 的 规则 ) 。 这 个 理由 被 广大 社 
会 研究 团体 、 多 数 机 构 审 查 委 员 会 以 及 美国 上 诉 法 院 所 支持 。 所 以 ， 我 们 
必须 放弃 “所 有 事情 都 需要 知情 同意 ”这 一 简单 规则 。 这 不 是 研究 人 员 必 须 
遵循 的 规则 ， 也 不 是 他 们 应 该 遵循 的 规则 。 


跳出 “所 有 事情 都 需要 知情 同意 ”这 一 框架 ， 研 究 人 员 面 临 着 一 个 棘手 的 问 
题 : 对 于 不 同 种 类 的 研究 ， 究 竟 需 要 何 种 形式 的 同意 ? 当然 ， 围 绕 这 个 问 
题 一 直 存 在 很 大 的 争议 ， 尽 管 其 中 大 部 分 讨论 都 是 在 模拟 时 代 的 医学 研究 
背景 下 进行 的 。 尼 尔 埃 亚 勒 ( Nir Eyal ) 在 2012 年 将 这 些 争论 总 结 为 : 


干预 的 风险 越 大 ， 越 是 能 影响 或 定义 “关键 的 生活 选择 ”; 干预 的 价值 载重 
和 争议 性 越 大 ， 干 预 直接 影响 的 身体 领域 就 拥有 越 多 隐私 ; 研究 人 员 越 是 
面临 冲突 与 无 监管 状态 ， 对 强 有 力 的 知情 同意 的 需求 就 越 高 。 在 其 他 情况 
下 ， 对 非常 有 力 的 知情 同意 的 需求 ， 对 所 有 事情 都 要 知情 同意 的 需求 ， 要 
少 得 多 。 在 这 种 情况 下 ， 高 成 本 可 能 很 轻松 地 超过 了 其 本 身 的 需求 。 


这 次 争论 得 出 的 一 个 重要 见解 是 ， 知 情 同 意 并 非 全 部 ， 也 不 是 一 无 是 处 ， 
有 更 强 形式 或 者 更 弱 形 式 的 同意 存在 。 在 一 些 场 景 中 ， 强 有 力 的 知情 同意 
似乎 非常 必要 ， 但 在 另 一 些 情况 下 ， 能 一 些 的 知情 同意 的 形式 可 能 更 合 
适 。 接 下 来 ， 我 会 描述 三 种 研究 人 员 可 能 努力 去 获取 知情 同意 的 理由 ， 并 
且 给 这 些 事例 提供 一 些 选项 。 


首先 ， 有 时 向 参与 者 提出 获取 知情 同意 可 能 增加 其 面 对 的 风险 。 艾 如 ， 
在 “Encore”" 项 目 中 ， 寻 求生 活 在 专制 政府 下 的 人 们 的 知情 同意 ， 用 他 们 的 
计算 机 测量 互联 网 审查 制度 ， 可 能 会 让 他 们 身 处 风险 更 高 的 境地 。 当 他 们 
的 同意 导致 风险 增加 时 ， 研 究 人 员 可 以 确保 他 们 正在 做 的 事情 的 信息 是 公 
开 的 ， 参 与 者 可 以 选择 退出 。 同 样 ， 研 究 人 员 也 可 以 寻求 代表 参与 者 的 组 
织 机 构 ( 例如 非 政 府 组 织 ) 。 


第 二 ， 有 时 在 研究 开始 之 前 获得 完全 知情 同意 可 能 会 损害 研究 的 科学 价 
值 。 警 如 ， 在 情绪 感 染 项 目 中 ， 如 果 参 与 者 获知 研究 人 员 正 在 做 一 个 关于 
情绪 的 实验 ， 就 可 能 改变 他 们 的 行为 。 阻 碍 参与 者 获取 信息 ， 甚 至 欺骗 他 


们 ， 在 社会 研究 中 并 不 少见 ， 特 别 是 在 心理 学 的 实验 研究 中 。 如 果 在 研究 
开始 之 前 无 法 获取 知情 同意 ， 那么 研究 人 员 可 以 (通常 也 这 样 ) 在 研究 结 
束 后 向 参与 者 进行 事后 说 明 。 这 样 的 事后 说 明 通 常 包括 阐述 实验 的 过 程 、 
对 任何 伤害 实施 补救 ， 以 及 事后 获取 同意 。 尽 管 如 此 ， 当 事后 说 明 本 身 可 
能 对 参与 者 造成 伤害 时 ， 有 关 是 否 在 实地 调查 中 对 参与 者 进行 说 明 ， 往 往 
存在 一 些 争议 (Finn and Jakobsson 2007 ) 。 


第 三 ， 有 时 向 受 影响 的 每 个 人 争取 知情 同意 在 逻辑 上 是 不 切实 际 的 。 黎 
如 ， 试想 一 下 ， 如 果 你 是 一 位 期 望 研究 比特 币 区 块 链 技术 ( 比特 币 是 一 种 
虚拟 货币 ， 区 块 链 是 比特 币 交易 的 公开 记录 ) 的 研究 人 员 。 不 幸 的 是 ， 获 
取 每 一 个 使 用 比特 币 的 人 的 知情 同意 是 不 可 能 的 ， 因 为 大 多 数 人 都 是 匿名 
的 。 在 这 样 的 情况 下 ， 研 究 人 员 可 以 尝试 联系 一 个 比特 币 使 用 者 作为 样 
本 ， 向 其 获取 知情 同意 。 


这 三 个 研究 人 员 可 能 无 法 取得 知情 同意 的 原因 ， 即 增加 风险 、 损 害 研 究 目 
标 以 及 逻辑 限制 ， 都 不 是 研究 人 员 努 力争 取 获 得 知情 同意 的 全 部 原因 。 我 
所 建议 的 解决 方案 一 一 向 公众 宣传 研究 成 果 、 人 允许 退出 的 选择 、 寻 求 第 三 
方 的 同意 、 事 后 说 明 ， 以 及 征求 参与 者 样本 的 同意 ， 在 所 有 情况 下 可 能 都 
无 法 实现 。 此 外 ， 即 使 这 些 替 代 方 案 是 可 行 的 ， 它 们 可 能 不 足以 用 于 既定 
的 研究 。 尽 管 如 此 ， 这 些 例 子 所 展示 的 知情 同意 既 不 是 全 部 ， 当 然 也 不 会 
是 一 无 是 处 。 创 造 性 的 解决 方案 可 以 在 无 法 获取 所 有 受 影响 方 完全 知情 同 
意 的 情况 下 ， 改 善 其 道德 平衡 。 


总 而 言 之 ， 比 起 “所 有 事情 都 需要 知情 同意 ”, 研究 人 员 应 该 、 可 以 并 且 也 
需要 遵循 一 个 更 复杂 的 准则 : 在 大 多 数 研 究 中 获得 某 种 形式 的 同意 。 就 原 
则 而 言 ， 出 于 对 人 的 尊重 原则 ， 知 情 同 意 既 不 是 必要 的 ， 也 不 是 充分 的 

( Humphreys 2015, p.102 ) 。 当 我 们 考虑 研究 伦理 时 ， 对 人 的 尊重 原则 
仅 是 需要 权衡 的 一 项 原则 ; 它 不 应 该 自动 硫 驾 于 有 利 化 原则 、 公 正 原 则 以 
及 对 法 律 和 公共 利益 的 尊重 原则 之 上 ， 在 过 去 的 40 年 中 ， 伦 理学 家 反复 指 
出 这 一 观点 (Gillon 2015, pp.112-113 ) 。 就 道德 框架 而 言 ， 对 每 一 件 事 
都 获得 知情 同意 就 是 完全 站 在 义务 论 的 角度 去 考虑 问题 ， 正 如 定时 炸弹 那 
个 例子 中 的 警察 一 样 (参见 6.5 节 ) 。 


最 终 ， 作 为 一 个 实际 问题 ， 如 果 你 正在 考虑 在 没有 任何 同意 的 情况 下 进行 
研究 ， 那 么 你 应 该 知道 自己 正 处 于 灰色 地 带 。 请 注意 回顾 研究 人 员 为 了 在 
未 经 同意 的 情况 下 进行 歧视 实验 研究 而 提出 的 道德 论点 。 你 的 理由 足够 强 
吗 ? 因为 知情 同意 是 许多 非 专业 道德 理论 的 核心 ， 你 应 该 知道 ， 你 很 可 能 
会 被 要 求 为 你 的 决定 进行 辩护 。 


6.6.2 理解 与 管理 信息 化 风险 


言 息 化 风险 是 社会 研究 中 最 普遍 的 风险 ， 它 急剧 增加 ， 也 是 最 难 理解 的 风 


险 。 


在 数字 时 代 的 社会 研究 中 ， 第 二 个 道德 挑战 就 是 信息 化 风险 ， 一 种 因 汇 露 
某 些 信息 而 带 来 的 潜在 伤害 (National Research Council 2014 ) 。 来 自 个 
人 信息 的 泄露 所 产生 的 信息 化 伤害 可 以 体现 在 经 济 方面 (比如 丢失 工 

作 ) 、 社 会 方面 ( 比如 身 处 乾 栓 境地 ) 、 心 理 方面 (比如 抑郁 ) ， 甚 至 是 
犯罪 方面 ( 比如 因 非 法 行为 被 捕 ) 。 不 幸 的 是 ， 在 数字 时 代 ， 这 种 信息 化 
伤害 急剧 增加 ， 因 为 我 们 的 行为 中 藏 有 更 多 的 信息 。 相 较 于 模拟 时 代 下 社 
会 研究 所 关心 的 风险 ， 比 如 自然 风险 ， 信 息 化 风险 更 难 被 理解 与 管控 。 


研究 人 员 减 少 信息 化 风险 的 一 项 措施 是 数据 “匿名 化 ”。“ 匿 名 化 ”是 从 数据 
中 移 除 请 如 姓名 、 住 址 以 及 电话 号 码 等 显著 个 人 信息 的 过 程 。 尽 管 如 此 , 
该 方法 远 不 如 许多 人 以 为 的 那样 有 效 ， 事 实 上 ， 这 种 方法 的 深度 和 广度 均 
受到 限制 。 因 此 ， 无 论 何 时 ， 在 描述 “匿名 化 ?时 ， 我 都 将 使 用 双 引 号 来 提 
醒 你 这 样 的 过 程 只 是 一 种 表面 的 匿名 ， 并非 真 正 的 匿名 。 


一 个 关于 “匿名 化 ”失败 的 生动 的 例子 来 自 20 世 纪 90 年 代 晚 期 的 马萨诸塞 州 
(Sweeney 2002 ) 。 团 体 保险 委员 会 ( GIC ) 是 一 个 政府 机 构 ， 对 缴纳 健 
康 保险 的 所 有 联邦 雇员 负责 。 通 过 这 样 的 工作 ， 团 体 保险 委员 会 搜集 到 了 
有 关联 邦 雇员 的 大 量 详尽 的 健康 记录 。 为 了 促进 研究 ， 团 体 保险 委员 会 决 
定 将 这 些 记录 发 布 给 研究 人 员 。 尽 管 如 此 ， 他 们 并 不 会 公布 所 有 的 数据 ; 
相反 ， 他 们 通过 删除 姓名 和 住址 等 信息 来 “匿名 化 ”这些 数据 。 但 是 ， 他 们 
留 下 了 自己 认为 可 能 对 研究 人 员 有 用 的 其 他 信息 ， 例 如 和 人口 统计 信息 ( 邮 
编 、 出 生日 期 、 族 裔 以 及 性 别 ) ， 医 疗 信息 (医生 访问 时 间 、 诊 断 以 及 实 
施 步 又 ) (图 6.4 ) (Ohm 2010 ) 。 不 幸 的 是 ， 这 种 “匿名 化 ?并 没有 充分 
保护 这 些 数 据 。 


姓名 


家 庭 住址 邮编 
邮编 出 生日 期 
出 生日 期 性 别 
性 别 RTS 
族 裔 访问 时 间 
访问 时 间 诊断 
诊断 实施 步骤 
实施 步骤 服用 药物 


服用 药物 


“匿名 化 ” 


图 6.4“ 匿 名 化 ”是 移 除 显 著 认 证 信息 的 过 程 。 比 如 ， 当 公开 联邦 雇员 的 医 
疗 is 马萨诸塞 州 团体 保险 委员 会 从 文件 中 移 除 姓 名 以 及 家 庭 住 
址 等 信 


为 了 说 明 团体 保险 委员 会 “匿名 化 ”的 缺点 ， 拉 塔 尼 娅 .斯 威 尼 (Latanya 
Sweeney )， 一 名 麻 省 理工 学 院 的 研究 生 ， 支付 了 20 美 元 购买 了 马萨诸塞 
州 州长 威廉 : 韦 尔 德 ( William Weld ) 的 故乡 剑桥 市 的 投 票 记 录 。 这 些 投票 
记录 包括 了 诸如 姓名 、 住 址 、 邮 编 、 生 日 以 及 性 别 等 信息 。 事 实 上 ， 医疗 
数据 文件 和 投票 记录 有 许多 共同 的 信息 ， 包 括 邮编 、 生 日 和 性 别 ， 这 意味 
着 斯 威 尼 也 可 以 将 其 联系 起 来 。 斯 威 尼 知 道 韦 尔 德 的 生日 是 1945 年 7 月 31 
日 ， 根 据 投票 记录 ， 剑 桥 市 只 有 6 个 人 有 同样 的 生日 。 再 进一步 ， 这 6 人 中 
只 有 3 人 是 男性 。 接 下 来 ，3 位 男性 中 只 有 一 人 跟 韦 尔 德 的 邮编 一 致 。 
此 ， 根据 投 票数 据 显示 的 内 容 ， 任 何人 都 外 Se 性 别 和 上 邮 
编 信息 与 医疗 记录 联系 起 来 找 出 韦 尔 德 。 本 质 上 ， 这 三 条 信息 在 数据 中 像 
是 他 的 一 个 独特 的 指纹 信息 。 通 过 这 样 的 结果 , 斯 威 尼 能 够 定位 出 韦 尔 德 
的 医疗 记录 ， 为 了 告知 韦 尔 德 她 的 成 就 ， 斯 威 尼 向 他 寄 送 了 一 份 数据 拷贝 
(Ohm 2010), 


斯 威 尼 的 工作 说 明了 “再 识别 攻击 ”的 基本 结构 ， 这 是 个 计算 机 安全 领域 
的 术语 。 在 这 些 攻击 中 ， 两 个 数据 库 本 身 者 没有 显示 敏感 信息 , 但 两 个 数 
据 库 是 相互 关联 的 ， 通 过 这 种 联系 ， 攻 击 者 使 得 敏感 信 4 息 被 暴露 。 


族 裔 
访问 时 间 
诊断 

实施 步骤 
服用 药物 


姓名 
住址 
be UK 


登记 日 期 


“匿名 化 ”医疗 记录 投票 记录 


图 6.5“ 匿 名 化 ”数据 的 再 识别 。 拉 塔 尼 娅 斯 威 尼 通 过 结合 投票 记录 和 “ 匿 
名 化 ”医疗 记录 ， 寻找 威廉 : 韦 尔 德州 长 的 医疗 记录 。 来 源 于 
Sweeney ( 2002 ) ， 图 1。 


为 了 回应 斯 威 尼 的 工作 和 其 他 相关 工作 ， 研 究 人 员 现 在 通常 在 整个 “匿名 
化 ?过 程 中 删除 更 多 的 信息 ， 即 所 谓 的 “个 人 识别 信息 ”(PII ) 

( Narayanan and Shmatikov 2010 ) 。 此 外 ， 许 多 研究 人 员 现 在 认识 到 , 
即使 在 “匿名 化 ?之 后 ， 某 些 数据 ( 如 医疗 记录 、 财 务 记 录 、 有 关 非 法 行为 
的 调查 问卷 回答 ) 也 可 能 过 于 敏感 。 我 要 讲 的 例子 表明 社会 研究 人 员 需 要 
改变 他 们 的 想法 。 作 为 第 一 步 ， 假 设 所 有 数据 都 有 可 能 被 识别 ， 并 且 所 有 
数据 都 可 能 是 敏感 的 ， 这 是 明智 的 。 换 句 话 说， 与 其 认为 信息 化 风险 适用 
于 一 小 部 分 项 目 ， 我 们 还 不 如 假设 它 在 某 种 程度 上 适用 于 所 有 项 目 。 


网 飞 奖 表明 了 这 种 重新 定位 的 两 个 方面 。 正 如 第 5 章 所 描述 的 ， 了 网 飞 公司 
公布 了 由 近 50 万 名 会 员 提供 的 1 亿 条 电影 评级 信息 ， 并 且 公 开征 集 来 自 世 
界 各 地 的 人 提交 的 算法 ， 以 提高 其 推荐 电影 的 能 力 。 在 公布 这 些 数据 之 
前 ， 网 飞 公司 移 除 了 所 有 显著 的 个 人 认证 信息 ， 比 如 姓名 等 。 他 们 还 增加 
了 一 项 特别 措施 ， 在 一 些 记 录 中 引入 了 轻微 的 干扰 项 ( 比如 将 某 些 评级 由 
4 星 改 为 3 星 ) 。 尽 管 如 此 ， 网 飞 很 快 发 现 ， 虽 然 他 们 付出 了 相应 的 努力 ， 
但 数据 仍然 不 是 匿名 的 。 


仅 在 他 们 公开 这 些 数据 的 两 周 后 ， 阿 尔 温 德 - 纳 拉 亚 南 与 维 塔 利 - 施 马 季 科 

夫 就 表明 ， 了 和 解 特定 人 群 的 电影 喜好 是 可 能 的 。 其 窍门 在 于 采用 与 斯 威 尼 
手法 相似 的 再 识别 攻击 : 把 两 个 信息 源 合 为 一 体 ， 一 个 信息 源 具有 潜在 的 
敏感 信息 ， 但 没有 明显 的 识别 信息 ， 另 一 个 包含 人 的 身份 信息 。 虽 然 各 自 


的 信息 源 可 能 都 是 相对 安全 的 ， 但 是 它们 被 合并 后 ， 就 增加 了 信息 化 风 
险 。 在 网 飞 数据 的 例子 中 ， 就 发 生 了 这 样 的 事 。 试 想 一 下 ， 当 我 选择 与 同 
事 分 享 我 天 于 动作 电影 与 喜剧 电影 的 想法 时 ， 我 并 不 会 愿意 分 享 我 对 宗教 
和 政治 类 电影 的 看 法 。 我 的 同事 可 能 利用 我 所 分 享 的 看 法 去 网 飞 数据 库 中 
找到 相关 信息 。 我 所 分 享 的 信息 可 能 像 威廉 . 韦 尔 德 的 生日 、 邮 编 、 性 别 信 
息 那 样 ， 成 为 一 个 独特 的 指纹 。 他 们 可 以 了 解 到 我 对 所 有 电影 的 评价 ， 包 
括 我 选择 不 分 享 的 电影 。 除 了 这 种 针对 单 人 的 目标 攻击 之 外 ， 纳 拉 亚 南 与 
施 马 季 科 夫 还 表明 ， 通 过 将 网 “ 飞 数 据 与 某 些 人 选择 在 互联 网 电影 数据 库 
(IMDb ) 上 发 布 的 电影 评级 数据 合并 ， 可 以 进行 广泛 攻击 ， 即 涉及 多 人 
的 攻击 。 很 简单 ， 任 何 特定 人 员 的 独特 指纹 信息 ， 即 使 是 他 们 的 电影 评级 
言 息 ， 都 可 以 用 于 识别 他 们 。 


尽管 网 飞 数 据 可 以 被 用 于 再 识别 攻击 或 广泛 攻击 ， 但 是 它 仅 可 能 是 低 风险 
的 。 毕 竞 ， 电 影评 级 信息 看 起 来 并 不 那么 敏感 。 虽 然 这 在 通常 情况 下 是 正 
确 的 ， 但 对 集中 了 50 万 人 的 数据 库 来 说 ， 电 影评 级 信息 可 能 就 相当 敏感 。 
事实 上 ， 作 为 对 再 识别 的 回应 ， 一 名 未 公开 身份 的 女 同 性 恋 者 加 入 了 对 网 
飞 公司 的 集体 诉讼 中 。 


网 飞 奖 数据 的 再 识别 说 明 , 所 有 数据 都 有 可 能 被 识别 ， 并 且 所 有 数据 都 可 
能 是 敏感 的 。 此 时 ， 你 可 能 会 认为 这 只 适用 于 那些 与 人 有 关 的 数据 。 令 
惊讶 的 是 ， 其 实 不 是 这 样 的 。 为 了 回应 《信息 自由 法 》 的 请 求 ， 纽 约 市 政 
府 公 开 了 2013 年 纽约 市 所 有 的 出 租车 行驶 记录 ， 包 括 其 接客 与 落 客 的 时 
间 、 位 置 以 及 付款 金额 等 信息 ( 回顾 第 2 章 ， 法 伯 使 用 了 类 似 的 数据 来 检 
验 劳动 经 济 学 中 的 重要 理论 ) 。 这 些 有 天 出 租车 行程 的 数据 可 能 看 起 来 没 
什么 问题 ， 因 为 它们 并 不 涉及 人 的 信息 ， 但 安东尼 : 托 卡 (Anthony 
Tockar ) 意识 到 这 些 出 租车 数据 库 实际 上 包含 了 许多 有 关 人 的 潜在 敏感 信 
息 。 为 了 确认 这 一 点 ， 他 浏览 了 午夜 到 早上 6 点 从 纽约 一 家 大 型 脱衣 舞 酒 
吧 出 发 的 行程 记录 ， 并 找到 其 落 客 位 置 。 这 项 搜索 实质 上 找 出 了 一 些 经 常 
光顾 这 个 酒吧 的 人 的 住址 ( Tockar 2014 ) 。 很 难 想象 市 政府 在 公布 数据 
时 是 否 考虑 到 了 这 一 点 。 事 实 上 ， 用 同样 的 办 法 可 以 找到 去 这 座 城 市 任何 
地 方 ， 包 括 去 诊所 、 政 府 大 楼 或 者 是 宗教 场所 的 人 的 家 庭 住址 。 


网 飞 奖 和 纽约 市 出 租车 数据 的 这 两 种 情况 表明 ， 相 对 有 经 验 的 人 也 可 能 
法 正确 地 估计 他 们 发 布 的 数据 中 存在 的 信息 化 风险 ， 而 这 些 案例 并 非 个 例 
( Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 
2016 ) 。 而 且 ， 在 许多 这 样 的 情况 下 ， 有 问题 的 数据 仍然 可 以 被 在 线 免费 
获取 ， 这 表明 撤销 已 发 布 的 数据 是 非常 困难 的 。 总 的 来 说 ， 这 些 例子 以 及 
计算 机 科学 关于 隐私 的 研究 引出 了 一 个 重要 的 结论 。 研 究 人 员 应 该 假定 所 
有 数据 都 有 可 能 被 识别 ， 并 且 所 有 数据 都 可 能 是 敏感 的 。 


不 幸 的 是 ， 并 不 存在 简单 的 解决 方案 ， 也 就 是 说 所 有 的 数据 都 可 能 被 识 


别 ， 并 且 所 有 数据 都 可 能 是 敏感 的 。 尽 管 如 此 ， 在 你 的 数据 工作 中 ， 其 中 
一 项 能 够 降低 信息 化 风险 的 措施 是 创建 并 遵循 一 个 数据 保护 计划 。 该 项 计 
划 能 够 降低 你 泄露 数据 的 概率 ， 并 且 在 数据 泄露 发 生 后 能 够 降低 伤害 。 随 
着 时 间 的 推移 ， 数 据 保护 计划 的 具体 项 目 ， 包 括 能 够 使 用 的 加 密 形式 ， 都 
在 改变 。 英 国 数据 服务 中 心 ( UK Data Services ) 有 效 地 归纳 了 数据 保护 
计划 所 必 备 的 5 项 要 素 ， 他 们 称 之 为 “5 个 安全 ”: 项 目 安全 、 对 象 安全 、 数 
据 安全 、 设 置 安全 、 成 果 安 全 ( 表 6.2 ) (Desai, Ritchie, and Welpton 
2016 ) 。 这 5 项 安全 措施 中 的 任何 单独 一 项 都 不 能 提供 完美 的 保护 措施 。 
但 是 将 它们 组 合 在 一 起 ， 则 可 以 有 力 降低 信息 化 风险 。 


表 6.2“5 个 安全 ”是 设计 和 执行 数据 保护 计划 的 原则 
安全 措施 行动 


项 目 安全 对 涉及 道德 伦理 的 项 目 数据 采取 限制 措施 


对 象 安全 访问 仅 限 于 可 信任 的 数据 人 员 ( 例如 ， 经 过 道德 培训 的 人 ) 


数据 安全 尽 可 能 将 数据 去 标识 并 汇总 


对 储存 于 计算 机 中 的 数据 采取 适当 的 物理 (例如 ， 锁 闭 的 房间 ) 
和 软件 ( 例如， 密码 保护 、 加 密 ) 保护 


设置 安全 


成 果 安 全 审查 研究 成 果 以 防止 意外 隐私 泄露 


除了 在 使 用 数据 时 保护 数据 以 外 ， 研 究 过 程 中 信息 化 风险 特别 突出 的 一 个 
步骤 是 与 其 他 研究 人 员 共享 数据 。 科 学 家 之 间 的 数据 共享 是 科学 探索 的 核 
心 价值 ， 并 且 它 能 够 在 很 大 程度 上 促进 知识 的 进步 。 以 下 是 美国 下 议院 对 
数据 共享 重要 性 的 看 法 (Molloy 2011) : 


如 果 研 究 人 员 要 重 现 、 验 证 文献 中 发 表 的 结果 并 在 其 基础 上 建立 其 他 研 
究 ， 获 取 数 据 是 至 关 重 要 的 。 因 此 我 们 必须 假定 ， 除 非 拥 有 很 强 的 其 他 理 
FA, 否则 数据 应 该 被 充分 披露 并 公开 。 


至 此 ， 当 与 其 他 研究 人 员 共 享 数据 时 ， 你 可 能 增加 了 你 的 信息 化 风险 。 
此 ， 似 乎 在 与 其 他 科学 家 分 享 数据 的 义务 和 为 参与 者 减少 信息 化 风险 的 义 
务 之 间 ， 共 享 数 据 这 一 行为 带 来 了 基础 性 的 紧张 关系 。 幸 运 的 是 ， 这 种 矛 
盾 并 不 像 看 起 来 那么 严重 。 相 反 ， 最 好 将 数据 共享 视 为 一 个 连续 统一 体 ， 
这 个 连续 统一 体 的 每 一 点 提供 了 不 同 的 社会 收益 与 参与 者 风险 的 组 合 ( 
6.6). 


- 无 特定 对 象 公开 


社会 收益 


参与 者 风险 


图 6.6 数据 共享 的 策略 位 于 一 个 连续 统一 体 之 中 。 你 应 该 在 这 个 连续 统一 
体 中 的 哪个 部 分 ， 取 决 于 你 的 数据 具体 细节 ， 第 三 方 监管 可 能 会 帮助 你 决 
定案 例 中 风险 收益 的 适当 平衡 。 这 条 曲线 的 确切 形状 取决 于 数据 和 研究 目 
标的 具体 情况 ( Goroff 2015 ) 。 


在 一 种 极端 情况 下 ， 你 可 以 不 对 任何 人 共享 你 的 数据 ， 这样 的 话 参 与 者 风 
险 也 就 最 小 化 了 ， 相 应 社会 收益 也 最 小 。 在 另 一 种 极端 情况 下 ， 你 可 以 无 
特定 对 象 公 开 ， 数 据 被 “匿名 化 ?并 被 所 有 人 使 用 。 相 较 于 不 公开 数据 ， 这 
种 无 特定 对 象 公开 能 够 提供 更 高 的 社会 收益 ， 但 也 随 之 给 参与 者 带 来 了 更 
高 的 风险 。 在 这 两 种 极端 情况 之 间 的 混合 范围 里 ， 存 在 一 种 我 称 之 为 保护 
性 公开 的 方法 。 在 这 样 的 方法 下 ， 你 可 以 将 数据 与 符合 特定 标准 并 同意 受 
某 些 规则 约束 的 人 共享 (比如 在 机 构 审查 委员 会 和 数据 保护 计划 的 监管 
下 ) 。 这 种 保护 性 公开 的 方法 提供 了 许多 公开 的 好 处 ， 并 减少 了 无 特定 对 
象 公开 的 风险 。 当 然 ， 这 样 的 方法 也 会 产生 很 多 问题 ， 比 如 ， 谁 能 获得 这 
样 的 权限 ， 在 什么 样 的 条 件 下 ， 能 使 用 多 久 ， 谁 又 为 这 样 的 保护 性 公开 所 
融 来 的 监管 成 本 埋单 等 ， 但 这 些 都 是 可 以 被 解决 的 。 事 实 上 ， 在 有 些 地 
方 ， 现 在 已 经 有 相应 的 保护 性 公开 方法 被 研究 人 员 采 用 了 “， 比 如 密歇根 大 
学 的 校 际 政治 及 社会 研究 联盟 (ICPSR ) 的 数据 档案 。 


那么 ， 你 在 研究 中 将 采取 何 种 数据 处 理 措施 ? 非 公 开 ， 保 护 性 公开 ， 还 是 
无 特定 对 象 公开 ? 这 个 取决 于 你 的 数据 的 具体 情况 ， 研 究 人 员 必 须 权衡 四 
项 原则 。 从 这 个 角度 看 ， 数 据 共享 并 不 是 一 个 独特 的 道德 难题 ， 它 只 是 研 
究 人 员 必 须 找到 合适 的 道德 平衡 的 许多 方面 之 一 。 


一 些 批评 家 普遍 反对 数据 共享 ， 在 我 看 来 ， 他 们 专注 于 风险 ， 这 无 疑 是 对 
的 ， 但 他 们 忽略 了 它 的 好 处 。 因 此 ， 为 了 鼓励 关注 风险 与 收益 ， 我 想 提供 
一 个 类 比 。 每 年 ， 因 为 汽车 所 产生 的 事故 都 会 造成 数 以 干 计 的 人 和 死亡， 但 
是 我 们 不 会 试图 禁止 驾车 。 事 实 上 ， 禁 止 驾车 的 呼吁 是 荒 廖 的 ， 因 为 加 
也 能 为 我 们 带 来 许多 美好 的 事情 ( 不 能 因 嘻 废 食 ) 。 相 反 ， 社 会 可 以 限制 
谁 能 驾车 ( 例如， 需要 达到 某 个 年 龄 并 通过 某 些 测试 ) ， 以 及 他 们 如 何 驾 
车 (例如 在 限 速 的 情况 下 ) ， 社 会 也 有 负责 执行 这 些 规定 的 人 员 (例如 警 
察 ) ， 我 们 会 惩 录 那些 违反 规则 的 人 。 同 样 ， 社 会 管理 名 车 问题 的 平衡 思 
想 也 可 以 用 于 数据 共享 的 过 程 。 也 就 是 说 ， 我 认为 我 们 可 以 通过 降低 风险 
和 提高 数据 共享 收益 ， 获 取 最 大 的 进展 ， 而 不 是 为 数据 共享 提供 绝对 的 支 
持 或 反对 论据 。 


总 而 言 之 ， 信 息 化 风险 增长 迅速 ， 并 且 很 难 预测 和 衡量 。 因 此 ， 最 好 假设 
所 有 的 数据 都 有 可 能 被 识别 ， 并 且 所 有 的 数据 都 可 能 是 敏感 的 。 为 了 在 研 
究 过 程 中 减少 信息 化 风险 ， 研究 人 员 可 以 创建 并 遵循 一 些 数据 保护 措施 。 
另外 ， 信 息 化 风险 不 会 阻止 研究 人 员 从 其 他 科学 家 处 获得 共享 数据 。 


6.6.3 隐私 权 
隐私 权 是 让 信息 适当 流通 的 权利 。 


第 三 个 研究 人 员 应 该 努力 完善 的 方向 是 隐私 权 。 劳 伦 斯 非常 简明 地 指 

出 :“ 隐 私 权 也 应 该 像 人 一 样 受到 尊重 。”( Lowrance 2012) 尽管 如 此 , 
隐私 权 是 一 个 众所周知 的 混乱 的 概念 (Nissenbaum 2010 ) 。 因 此 ， FS 
试 做 出 有 关 研 究 的 特定 决策 时 ， 使 用 它 很 困难 。 


考虑 隐私 权 的 常见 方式 是 公 / 私 二 分 法 。 通 过 这 样 的 思考 方法 ， 如 果 信 息 
可 以 公开 获取 ， 那 么 研究 人 员 使 用 它 就 不 用 在 意 侵犯 了 公民 的 隐私 权 。 然 
而 使 用 这 样 的 方法 会 产生 问题 。 例 如 ， 在 2007 年 11 月 ， 科 斯 塔 斯 - 帕 纳 戈 
普 洛斯 ( Costas Panagopoulos ) 向 三 个 城镇 的 每 个 人 发 出 了 关于 即将 举行 
选举 的 信件 。 在 艾 奥 瓦 州 的 蒙 蒂 塞 洛 和 密歇根 州 的 霍 兰 这 两 个 小 镇 ， 帕 纳 
% 普 洛斯 在 报纸 上 保证 /威胁 将 要 公布 一 份 参与 投票 的 人 的 名 单 。 在 另 一 
个 小 镇 ， 艾 奥 瓦 州 的 伊利 ， 帕 纳 戈 普 洛 斯 保证 /威胁 公布 一 份 没有 投票 的 
人 的 名 单 。 这 些 措施 旨 在 引发 自豪 感 与 着 耻 感 (Panagopoulos 2010) , 
因为 这 些 情绪 在 早期 研究 中 被 发 现 会 影响 投票 率 ( Gerber, Green, and 
Larimer 2008 ) 。 在 美国 有 关 谁 参与 投票 、 谁 未 参与 投票 的 信息 是 公开 


的 ， 并 且 任 何人 都 可 以 获取 。 因 此 ， 有 人 可 能 会 争辩 说 ， 因 为 这 个 投票 信 
息 已 经 公开 了 “， 所 以 研究 人 员 在 报纸 上 公布 它 没有 问题 。 但 这 个 论点 对 某 
些 人 来 说 则 会 引起 不 适 。 


正如 这 个 例子 所 说 明 的 那样 ， 公 / 私 二 分 法 太 过 愚 钝 了 (Boyd and 
Crawford 2012; Markham and Buchanan 2012 ) 。 思 考 隐 私 权 的 一 种 更 
好 的 方式 是 情境 完整 性 ， 这 是 一 种 专门 用 于 处 理 数字 时 代 问 题 的 方法 
(Nissenbaum 2010 ) 。 情 境 完整 性 关注 的 是 信息 流通 ， 而 不 是 将 信息 视 
为 公共 或 私人 信息 。 引 述 尼 森 鲍 姆 (Nissenbaum ) 的 话 :“ 隐 私 权 既 不 是 
保密 权 ， 也 不 是 控制 权 ， 而 是 适当 流通 个 人 信息 的 权利 。?” 


情境 完整 性 的 基本 概念 是 与 情境 相关 的 信息 化 规范 (Nissenbaum 
2010 ) 。 这 就 是 管理 特定 情境 中 信息 流通 的 规范 ， 它 们 由 三 个 要 素 决 定 : 


角色 ( 主体、 发 送 者 、 接 收 者 ; 
:属性 ( 信息 类 型 ; 
传输 原则 ( 信息 流通 的 限制 ) 。 


因此 ， 作 为 一 名 研究 人 员 ， 当 你 正在 决定 是 否 未 经 允许 使 用 数据 时 ， 它 能 
够 帮助 你 询问 自己 ， 这 样 做 是 否 侵犯 了 与 情境 相关 的 信息 化 规范 。 回 到 帕 
纳 戈 普 洛斯 的 例子 来 ， 在 这 个 例子 中 ， 外 部 研究 人 员 在 报纸 上 公开 选民 或 
非 选民 名 单 ， 这 似乎 可 能 会 违背 信息 化 规范 。 这 可 能 不 是 人 们 期 望 的 信息 
流通 方式 。 事 实 上 ， 帕 纳 戈 普 洛 斯 没有 执行 他 的 保证 /威胁 ， 因 为 当地 选 
举 官员 从 这 些 信件 中 追查 到 他 ， 并 劝 他 说 这 并 不 是 一 个 好 的 想法 
(Issenberg 2012, p. 307). 


与 情境 相关 的 信息 化 规范 ， 也 可 以 帮助 评估 我 在 本 章 开始 时 讨论 的 情况 ， 
即 2014 年 在 西非 埃 博 拉 疫 情 暴发 期 间 使 用 手机 通话 记录 追踪 人 口 流动 性 的 
例子 ( Wesolowski et al. 2014 ) 。 在 这 样 的 环境 设 定 中 ， 我 可 以 想到 两 种 
不 同 的 情境 : 


情境 1 : 发 送 完整 的 通话 记录 数据 ( 属性 ) ; 给 不 完全 合法 的 政府 ( 角 
色 ) ; 用 以 应 对 未 来 任何 可 能 的 使 用 〈 传输 原则 ) 。 

情境 2 : 发 送 部 分 匿名 记录 (Blt) ; 给 受 苯 敬 的 大 学 研究 人 员 (A 
色 ) ; 用 以 应 对 埃 博 拉 疫 情 ， 并 接受 大 学 机 构 委 员 会 的 监督 ( 传输 原 
则 ) 。 


尽管 在 这 两 种 情境 下 ， 通 话 数据 都 从 移动 通信 公司 流出 ， 但 鉴于 角色 、 属 
性 和 传输 原则 之 间 的 差异 ， 这 两 种 情况 的 信息 化 规范 并 不 相同 。 只 关注 其 


中 一 个 参数 可 能 导致 过 于 简单 的 决策 。 事 实 上 ， 尼 和 森 鲍 姆 强调 ， 这 三 个 参 
数 不 能 缩减 为 其 他 两 个 参数 ， 任 何 单一 参数 也 不 能 单独 定义 信息 化 规范 。 
言 息 化 规范 的 三 维 性 质 解释 了 为 什么 过 去 的 努力 ， 即 侧重 于 属性 或 传输 原 
则 的 努力 ， 在 保护 隐私 方面 效果 不 佳 。 


用 与 情境 相关 的 信息 化 规范 来 指导 决策 的 一 个 挑战 是 ， 研 究 人 员 可 能 不 会 
提前 知道 它们 ， 并 且 它 们 很 难 衡量 ( Acquisti, Brandimarte, and 
Loewenstein 2015 ) 。 进 一 步 来 说 ， 即 使 一 些 研究 人 员 会 违反 与 情境 相关 
的 信息 化 规范 ， 也 并 不 自动 意味 着 其 研究 不 应 该 进行 。 事 实 上 ， 尼 森 鲍 姆 
著作 的 第 8 章 完全 阐明 了 “为 了 好 事 而 破坏 规则 ”。 尽管 存在 这 些 复杂 性 ， 
但 是 与 情境 相关 的 信息 化 规范 仍然 是 推断 隐私 权 相 关 问题 的 有 用 方式 。 


最 后 ， 隐 私 权 的 问题 是 我 所 见 过 的 优先 考虑 对 人 的 尊重 原则 与 优先 考虑 有 
利 化 原则 的 研究 人 员 之 间 普 遍 存 在 误解 的 地 方 。 试 想 一 下 ， 公 共 卫 生 研究 
人 员 为 了 防止 新 型 传染 病 的 传播 ， 秘 密 观察 了 正在 洗澡 的 人 们 。 关 注 有 利 
化 原则 的 研究 人 员 在 乎 这 项 研究 对 社会 带 来 的 好 处 ， 并 且 可 能 会 争辩 说 ， 
如 果 研 究 人 员 在 没有 被 发 现 的 情况 下 进行 了 偷 看 行为 ， 那 么 参与 者 就 没有 
受到 伤害 。 另 一 方面 ， 优 先 考 虑 对 人 的 尊重 原则 的 研究 人 员 关 注 的 是 研究 
人 员 没 有 对 人 的 起 码 苯 重 ， 并 可 能 认为 这 侵犯 了 参与 者 的 隐私 权 ， 造 成 了 
伤害 ， 即 使 在 参与 者 没有 意识 到 他 们 被 偷 看 的 情况 下 。 换 句 话 说， 对 这 些 
研究 人 员 来 说 ， 侵 犯人 们 的 隐私 权 本 身 就 是 一 种 伤害 。 


总 而 言 之 ， 在 考虑 隐私 权 问 题 时 ， 这 有 助 于 我 们 超越 过 于 简单 化 的 公 / 私 
二 分 法 ， 而 采用 与 情境 相关 的 信息 化 规范 ， 其 由 三 个 要 素 组 成 : 角色 ( 主 
体 、 发 送 者 、 接 收 者 ) ， 属 性 ( 信息 类 型 ) ， 以 及 传输 原则 〈 信息 流通 的 
限制 ) (Nissenbaum 2010 ) 。 一 些 研究 人 员 根 据 隐私 侵害 可 能 导致 的 伤 
害 来 评估 隐私 权 ， 而 其 他 研究 人 员 则 认为 侵犯 隐私 权 本 身 就 是 一 种 伤害 。 
许多 数字 系统 的 隐私 概念 随时 间 而 变化 ， 因 人 而 异 ， 并 且 因 情况 而 异 

( Acquisti, Brandimarte, and Loewenstein 2015 ) ， 因 此 隐私 权 很 可 能 在 
未 来 某 些 时 候 成 为 研究 人 员 在 伦理 决策 中 遭遇 困难 的 根源 。 


6.6.4 面 对 不 确定 性 做 出 决策 
不 确定 性 不 一 定 导致 无 所 作为 。 


我 期 望 研究 人 员 努 力 的 第 四 个 也 是 最 后 一 个 领域 是 面 对 不 确定 性 做 出 决 
策 ， 也 就 是 说 ， 在 哲学 化 和 权衡 利弊 、 研 究 伦理 问题 后 ， 决 定做 什么 和 不 
做 什么 。 不 幸 的 是 ， 这 些 决 策 往往 基于 不 完整 的 信息 。 和 譬如 ， 当 设 

计 “Encore” 项 目 时 ， 研 究 人 员 可 能 希望 知道 它 会 导致 某 人 被 和 警方 找 上 门 的 
可 能 性 。 或 者 在 设计 情绪 传染 项 目 时 ， 研 究 人 员 可 能 希望 知道 它 引 发 某 些 
参与 者 抑郁 的 可 能 性 。 这 些 概率 可 能 非常 低 ， 但 在 研究 发 生 之 前 它们 是 未 


AM, 而且， 因为 这 两 个 项 目 都 没有 公开 追踪 有 天 不 良 事 件 的 信息 ， 所 以 
其 概率 仍然 不 为 众人 所 知 。 


在 数字 时 代 ， 不 确定 性 并 不 是 社会 研究 所 特有 的 。 当 《贝尔 蒙 报 告 》 描 述 
了 风险 与 收益 的 系统 评估 时 ， 它 明确 承认 这 些 很 难 精确 量化 。 尽 管 如 此 , 
这 些 不 确定 性 在 数字 时 代 更 为 严重 ， 部 分 原因 是 我 们 对 这 类 研究 的 经 验 较 
少 ， 另 外 一 部 分 原因 在 于 其 研究 本 身 的 特点 。 


鉴于 这 些 不 确定 因素 ， 有 些 人 似乎 主张 “安全 性 高 于 遗憾 的 产生 ”, 这 是 预 
防 原则 的 口语 化 解释 。 虽 然 这 种 方法 看 似 是 合 理 的 ， 甚 至 可 能 是 明智 的 ， 

但 它 实 际 上 可 能 会 造成 伤害 。 它 让 研究 环境 变 得 冷淡 ， 并 且 导 致 人 们 对 局 
势 的 看 法 过 于 狭隘 (Sunstein 2005 ) 。 为 了 更 好 地 理解 预防 原则 的 问题 , 
让 我 们 回 到 情绪 感染 的 例子 中 。 实 验 计划 涉及 大 约 70 万 人 人， 实验 中 肯定 有 
人 会 受到 伤害 。 但 是 ， 这 个 实验 也 有 可 能 产生 对 脸谱 网 用 户 和 社会 有 益 的 
知识 。 因 此 ， 虽然 允许 实验 有 风险 ( 正如 已 经 充分 讨论 过 的 那样 , (BRE 
碍 实验 也 有 风险 ， 因 为 实验 可 能 会 产生 宝贵 的 知识 。 当 然 ， 选 择 做 还 是 不 
做 实验 并 不 是 在 实验 发 生 时 进行 的 。 对 实验 设计 有 很 多 修改 方式 ， 它 们 可 
能 将 其 带 入 不 同 的 道德 平衡 。 然 而 ， 在 某 些 时 候 ， 研 究 人 员 可 以 在 做 研究 
和 不 做 研究 之 间 做 出 选择 。 行 动 和 不 行动 都 有 风险 ， 仅 仅 关 注 行动 的 风险 
是 不 恰当 的 。 原 因 很 简单 ， 并 不 存在 完全 无 风险 的 方法 。 


跳出 预防 原则 的 限制 ， 在 面 对 不 确定 性 时 做 出 决定 的 一 个 重要 方法 是 最 小 
化 风险 标准 。 该 标准 试图 将 特定 研究 的 风险 和 参与 者 在 日 常生 活 中 承担 的 
风险 ( 例如 运动 或 驾车 ) 进行 比较 ( Wendler et al. 2005 ) 。 这 种 方法 是 
有 价值 的 ， 因 为 评估 是 否 符合 最 低 风 险 标 准 比 评估 实际 风险 水 平 更 容易 。 
20, 在 情绪 感染 项 目 中 ， 在 研究 开始 之 前 ， 研 究 人 员 可 以 将 实验 中 新 消 
息 反 馈 的 情绪 内 容 与 脸谱 网 上 的 其 他 新 消息 反馈 的 情绪 内 容 进 行 比 较 。 如 
果 它 们 是 相似 的 ， 那 么 研究 人 员 就 可 以 在 符合 最 小 风险 标准 的 情况 下 进行 
实验 (Meyer 2015 ) 。 即 使 不 知道 风险 的 绝对 程度 ， 他 们 也 可 以 做 出 这 个 
决定 。 该 方法 同样 可 以 应 用 于 “Encore” 项 目 中 。 最 初 ，“Encore” 项 目 触发 
了 对 已 知 敏感 网 站 的 请 求 ， 例 如 那些 专制 政府 所 禁止 的 政治 党 派 网 站 。 
此 ， 这 对 某 些 国家 的 参与 者 来 说 风险 不 小 。 正 因 如 此 ，“Encore” 的 修订 版 
本 仅 向 推 特 、 脸 谱 网 和 优 免 发 出 请 求 ， 这 样 的话 它 就 符合 最 小 化 风险 的 标 
准 ， 因 为 其 请 求 是 在 人 们 正常 浏览 网 页 期 间 触 发 的 (Narayanan and 
Zevenbergen 2015 ) 。 


当 他 们 决定 进行 具有 未 知 风险 的 研究 时 ， 第 二 个 重要 思想 是 效果 分 析 ， 它 
允许 研究 人 员 计 算 他 们 所 需要 的 样本 大 小 ， 从 而 可 靠 地 检测 对 给 定 大 小 的 
样本 的 影响 (Cohen 1988 ) 。 如 果 你 的 研究 可 能 使 参与 者 面临 风险 ， 即 使 
是 最 小 的 风险 ， 那 么 根据 有 利 化 原则 ， 你 也 应 该 为 实现 研究 目标 而 设置 最 
小 的 风险 ( 回 到 第 4 章 中 的 减少 参与 者 原则 ) 。 尽 管 一 些 研究 人 员 倾 向 于 


让 他 们 的 研究 规模 尽 可 能 大 ， 但 研究 伦理 建议 研究 规模 应 该 尽 可 能 小 。 效 
果 分 析 当 然 不 是 新 功能 ， 但 它 在 模拟 时 代 的 使 用 方式 与 今天 有 着 重要 的 区 
别 。 在 模拟 时 代 ， 研 究 人 员 通 过 进行 效果 分 析 ， 确 保 他 们 的 研究 规模 不 是 
大 小 〈 即 效能 不 足 ) 。 然 而 ， 现 在 的 研究 人 员 应 该 利用 效果 分 析 确 保 他 们 
的 实验 规模 不 会 过 大 即 效能 过 剩 ) 。 


最 低 风 险 标准 和 效果 分 析 可 以 帮助 你 衡量 和 设计 研究 ， 但 是 它们 无 法 提供 
任何 有 关 参 与 者 如 何 看 待 你 的 研究 以 及 他 们 参与 研究 会 遇 到 什么 风险 之 类 
的 新 信息 。 处 理 不 确定 性 的 另 一 种 方法 就 是 搜集 更 多 的 信息 ， 即 进行 道德 
反应 调查 与 阶段 性 测试 。 


在 道德 反应 调查 中 ， 研 究 人 员 会 对 提议 的 研究 项 目 进行 简要 描述 ， 然 后 提 
出 两 个 问题 : 


:问题 1 :“ 如 果 你 关心 的 人 是 这 个 实验 的 候选 参与 者 ， 你 是 否 希 望 他 成 为 
参与 者 ? ”回答 是 、 无 所 谓 、 否 ，; 


:问题 2 :“ 你 认为 应 该 允许 研 究 人 员 继续 这 个 实验 吗 ? ”回答 是 、 是 ( 但 是 
要 注意 ) 、 不 确定 、 否 。 


在 每 个 问题 被 回答 之 后 ， 回 答 者 都 可 以 解释 他 们 的 答案 。 最 后 ， 可 能 成 为 
参与 者 的 人 或 可 能 从 微 任务 劳动 力 市 场 ( 如 机 器 人 MTurk ) 被 招募 的 受 访 
者 也 会 回答 一 些 基 本 的 人 口 统计 学 问题 。 


道德 反应 调查 有 三 个 特点 ， 我 认为 特别 具有 吸引 力 。 首 先 ， 它 们 在 研究 之 
前 就 已 经 发 生 ， 因 此 可 以 在 研究 开始 之 前 预防 问题 的 产生 ( 这 与 监测 不 良 
反应 的 方法 相反 ) 。 其 次 ， 道 德 反 应 调查 的 受 访 者 通常 不 是 研究 人 员 ， 
此 这 有 助 于 研究 人 员 从 公众 的 角度 看 待 他 们 的 研究 。 最 后 ， 道 德 反 应 调查 
使 研究 人 员 能 够 提出 多 个 版 本 的 研究 项 目 ， 以 评价 不 同 版 本 对 同一 项 目的 
伦理 平衡 。 尽 管 如 此 ， 道德 反应 调查 的 一 个 局 限 性 是 ， 在 调查 结果 给 出 的 
不 同 研究 设计 之 间 ， 如 何 做 出 决定 ， 它 并 不 明确 。 但 是 ， 忽 略 这 种 局 限 
性 ， 道德 反应 调查 不 失 为 是 有 帮助 的 ; SALLE , BHR (Schechter ) 和 
布 拉 沃 : 利 洛 ( Bravo-Lillo ) 就 放弃 了 一 项 计划 中 的 研究 ， 以 回应 参与 者 在 
道德 反应 调查 中 提出 的 问题 。 


虽然 道德 反应 调查 有 助 于 评估 对 计划 研究 的 反应 ， 但 它们 无 法 衡量 不 良 事 
件 的 可 能 性 或 严重 程度 。 医 学 研究 人 员 处 理 高 风险 环境 下 不 确定 性 的 一 种 
方法 是 进行 阶段 性 实验 ， 这 种 方法 可 能 对 某 些 社会 研究 有 帮助 。 当 测试 新 
药 的 有 效 性 时 ， 研 究 人 员 不 会 立即 跳 至 大 规模 的 随机 对 照 实验 的 阶段 。 相 
反 ， 他 们 首先 进行 两 种 类 型 的 研究 。 最 初 ， 在 I 期 试验 中 ， 研 究 人 员 特 别 关 
注 寻找 安全 剂量 ， 这 阶段 研究 仅 涉 及 少数 人 。 一 旦 确定 了 安全 剂量 ，II 期 


试验 就 会 评估 该 药物 的 疗效 ， 即 评估 其 在 最 佳 情 况 下 的 有 效 性 (Singal， 
Higgins, and Waljee 2014), 。 只 有 在 ]I 期 与 II 期 试验 完成 后 ， 新 的 药物 才 
被 允许 投入 大 规模 的 随机 对 照 实验 中 。 虽 然 用 于 开发 新 药 的 分 阶段 实验 的 
确切 结构 可 能 不 适合 用 来 进行 社会 研究 ， 但 当面 临 不 确定 性 时 ， 研 究 人 员 
可 以 开展 针对 安全 性 和 有 效 性 的 小 规模 研究 。 璧 如 ， 在 “Encore” 项 目 中 ， 
你 可 以 想象 研究 人 员 从 来 自 更 讲究 法 治 的 国家 的 参与 者 开始 研究 。 


总 之 ， 这 4 种 方法 ， 即 最 低 风险 标准 、 效 果 分 析 、 道 德 反 应 调查 以 及 分 阶 
段 实验 ， 即 使 在 面 对 不 确定 性 的 情况 下 ， 都 可 以 帮助 你 以 合理 的 方式 进行 
研究 。 不 确定 性 并 不 一 定 导 致 无 所 作为 。 


6.7 实用 技巧 
除了 高 尚 的 道德 原则 以 外 ， 研 究 道德 伦理 还 存在 实际 操作 问题 。 


除了 本 章 描述 的 道德 原则 与 道德 框架 之 外 ， 我 还 想 根 据 我 在 数字 时 代 推 
动 、 审 查 和 讨论 的 社会 研究 中 的 个 人 经 验 ， 提 供 三 条 实用 技巧 : 机 构 审 查 
员 会 是 底线 ， 不 是 上 线 ; 换 位 思考 ; 将 研究 伦理 视 作 连续 的 而 非 离散 的 


过 程 。 
6.7.1 机 构 审 查 委 员 会 是 底线 ， 不 是 上 线 


一 方面 ， 许 多 研究 人 员 似乎 与 机 构 审 查 委员 会 持 相反 的 观点 ; 另 一 方面 ， 
他 们 认为 机 构 审 查 委 员 会 就 是 装模作样 的 官僚 机 构 。 然 而 ， 与 此 同时 ， 他 
们 也 认为 它 是 伦理 问题 决策 的 最 终 仲裁 者 。 也 就 是 说 ， 大 多 数 研究 人 员 似 
乎 认为 一 旦 机 构 审 查 委员 会 通过 了 审查 ， 那 这 样 做 就 没 问 题 。 如 果 我 们 承 
认 机 构 审查 委员 会 目前 存在 的 非常 真实 的 局 限 性 ， 并 且 很 多 人 也 这 样 认为 
( Schrag 2010, 2011; Hoonaard 2011; Klitzman 2015; King and Sands 
2015; Schneider 2015) ， 那 么 我 们 作为 研究 人 员 必 须 为 研究 道德 承担 额 
外 的 责任 。 机 构 审 查 委员 会 是 底线 ， 不 是 上 线 ， 这 个 想法 有 两 个 主要 含 
义 。 


首先 ， 机 构 审查 委员 会 是 底线 意味 着 ， 如 果 你 在 需要 机 构 审 查 委 员 会 监管 
的 部 门 工 作 ， 那么 你 应 该 遵循 这 些 规定 。 这 似乎 是 显然 的 ， 但 是 我 注意 到 
有 些 人 似乎 希望 能 够 避 开 机 构 审 查 委员 会 。 事 实 上 ， 如 果 你 在 伦理 上 不 确 
定 的 领域 工作 ， 那 么 机 构 审 查 委 员 会 可 以 成 为 一 个 强大 的 盟友 。 如 果 你 遵 
循 他 们 的 原则 ， 即 使 在 你 的 研究 出 了 问题 时 ， 他 们 也 应 该 支持 你 (King 
and Sands 2015 ) 。 如 果 你 不 遵守 规则 ， 可 能 就 要 在 非常 困难 的 情况 下 自 
行 解决 。 


其 次 ， 机 构 审查 委员 会 不 是 上 线 意 味 着 ， 只 填写 表格 并 遵守 规则 是 不 够 
的 。 在 许多 情况 下 ， 你 作为 研究 人 员 ， 应 该 是 最 了 解 如 何 遵守 道德 规范 的 
人 人。 最终， 作为 研究 人 员 ， 道 德 责任 在 于 你 ， 你 的 名 字 会 被 写 在 文献 上 。 


确保 你 将 机 构 审查 委员 会 作为 底线 而 不 是 上 线 的 一 种 办 法 是 在 论文 中 加 入 
道德 附录 。 事 实 上 ， 你 可 以 在 研究 开始 之 前 就 起 草 道德 附录 ， 以 便 强迫 自 
己 考虑 如 何 向 同事 和 公众 解释 你 的 工作 。 如 果 你 在 起 草 道德 附录 时 发 现 自 
己 感到 不 适 ， 那 么 你 的 研究 可 能 未 达到 适当 的 伦理 平衡 。 除 了 帮助 你 判断 
工作 外 ， 公 布道 德 附录 还 有 助 于 研究 界 讨论 伦理 问题 ， 并 根据 真实 实证 研 
究 中 的 实例 建立 适当 的 规范 。 表 6.3 罗 列 了 我 认为 对 伦理 研究 有 良好 讨论 


价值 的 实证 研究 论文 。 我 并 不 同意 这 些 论文 作者 在 讨论 中 提出 的 所 有 声 
明 ， 但 是 他 们 都 是 卡特 (Carter 1996) 定义 下 的 完整 性 研究 人 员 的 例子 : 
在 每 个 例子 中 , (1) 研究 人 员 都 决定 出 他 们 认为 是 对 的 和 错 的 事情 ， 
(2) 他 们 根据 自己 的 决定 采取 行动 ， 即 使 是 在 个 人 成 本 方面 ;( 3 ) 他 们 
公开 表示 的 行为 是 基于 对 情境 的 道德 分 析 的 。 


表 6.3 关于 伦理 引发 有 趣 讨论 的 论文 
研究 人 员 研究 项 目 


未 经 同意 的 实地 调查 


van de Rijt et al. (2014) wis daa ace oe spp aes 
: 避免 情境 伤害 


发 展 中 国家 的 实地 调查 
敏感 话题 的 研究 
复杂 的 同意 议题 

对 可 能 造成 伤害 的 补救 


Paluck and Green (2009) 


未 经 同意 的 研究 


Burnett and Feamster (2015) RI a D A een 
在 风险 难以 评估 的 情况 下 进行 风险 收益 权衡 


社会 影响 的 研究 


Chaabane et al. (2014) i 
使 用 泄露 的 数据 文件 


Jakobsson and Ratkiewicz 
(2006) 


未 经 同意 的 实地 调查 


Soeller et al. (2016) 


6.7.2 换 位 思考 


研究 人 员 通 常 非常 关注 其 工作 的 科学 目标 ， 他 们 只 能 通过 这 个 角度 看 到 世 

界 。 这 样 的 短视 可 能 会 和 成 伦理 上 的 错误 六 因此 ， 当 你 思考 你 的 研究 

时 ， 试想 一 下 ， 你 的 参与 者 、 利 益 相 关 者 甚至 是 记者 会 对 研究 做 出 什么 样 
的 反应 。 UD on 相反 ， 你 试 
图 想象 其 他 人 会 如 何 感受 ， 这 个 过 程 可 生 引发 同 理 心 或 者 叫 换 位 思考 ) 
(Batson, Early, and | 1997 ) 。 从 这 些 不 同 的 角度 思考 你 的 工 

作 ， 可 以 帮助 你 面 对 问 题 并 让 你 的 工作 具备 更 好 的 道德 平衡 。 


此 外 ， 当 从 别人 的 角度 想象 你 的 工作 时 ， 你 应 该 期 望 他 们 可 能 注意 到 有 某 些 
具体 的 、 精 糕 的 情况 。 譬 如， 为 了 回应 情绪 感染 项 目 ， 一 些 批评 家 专注 于 
那些 可 能 造成 自杀 的 可 能 性 ， 这 是 一 种 低 概率 但 是 很 极端 的 糟糕 情况 。 一 
旦 人 们 的 情绪 受到 刺激 而 关注 最 坏 的 情况 ， 他 们 可 能 会 完全 放弃 这 种 糟糕 


情况 之 外 的 可 能 性 ( Sunstein 2002 ) 。 然 而 ， 人 们 可 能 在 情绪 上 做 出 反应 
的 事实 并 不 意味 着 你 应 该 将 他 们 视 为 不 知情 、 非 理性 或 是 思春 的 。 我 们 都 
应 该 谦逊 地 意识 到 ， 我 们 之 中 没有 一 个 人 拥有 完美 的 道德 观 。 


6.7.3 将 研究 伦理 视 作 连续 的 而 非 离散 的 过 程 


数字 时 代 社 会 研究 的 伦理 争议 经 常 是 二 元 ( 对 与 错 ) 的 。 璧 如， 情绪 感染 
项 目 是 一 个 要 么 道德 要 么 不 道德 的 项 目 。 这 种 二 元 思维 使 讨论 变 得 极端 ， 
阻碍 了 开发 共享 规范 的 努力 ， 使 思想 懒惰 。 研 究 被 打上 了 “道德 ”的 标签 ， 
这 使 研究 人 员 免 除了 更 加 道德 地 行事 的 责任 。 我 所 见 过 的 涉及 研究 伦理 的 
最 有 成 效 的 对 话 超越 了 这 种 二 元 思维 ， 成 为 天 于 研究 伦理 的 一 个 连续 的 概 
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研究 伦理 二 元 概念 的 一 个 主要 实际 问题 是 它 会 使 讨论 变 得 偏激 。 把 情绪 感 
染 项 目 称 为 “不 道德 的 ”，, 会 以 一 种 无 益 的 方式 将 它 与 真正 的 暴行 混 为 一 
谈 。 相 反 ， 更 具体 地 讨论 研究 中 遇 到 的 问题 会 更 有 帮助 并 且 更 恰当 。 摆 脱 
二 元 思维 和 偏激 的 语言 并 不 代表 我 们 要 用 模棱两可 的 语言 隐藏 不 道德 的 行 
为 。 相 反 ， 我 认为 ， 连 续 的 道德 概念 将 带 来 更 加 谨慎 和 精确 的 语言 。 此 
外 ， 研 究 伦 理 的 连续 概念 可 以 厘清 这 样 一 个 概念 : 每 个 人 ， 甚 至 那些 正在 
从 事 “ 道 德 的 ”工作 的 研究 人 员 ， 都 应 该 努力 在 其 工作 中 创造 更 好 的 道德 平 
衡 。 


迈 向 持续 思考 的 最 终 益 处 在 于 ， 它 鼓励 了 谦逊 的 智慧 ， 而 谦逊 的 智慧 在 遇 


到 困难 的 道德 挑战 时 是 有 益 的 。 数 字 时 代 的 研究 伦理 问题 是 复杂 的 ， 任 何 
一 个 人 都 不 应 该 对 自己 判断 正确 行为 的 能 力 过 于 自信 。 


6.8 结论 


数字 时 代 的 社会 研究 引发 了 新 的 伦理 问题 ， 但 这 些 问 题 并 非 不 可 解决 。 作 
为 一 个 社 群 ， 如 果 我 们 可 以 制定 由 研究 人 员 和 公众 支持 的 共同 道德 准则 和 
标准 ， 那 么 就 能 以 对 社会 负责 任 和 有 益 的 方式 利用 数字 时 代 的 能 力 。 本 章 
表达 了 我 试图 将 我 们 推 向 这 个 方向 的 想法 ， 并 且 我 认为 ， 关 键 是 研究 人 员 
应 该 采取 基于 原则 的 思维 方式 ， 同 时 继续 遵守 适当 的 规则 。 


在 6.2 节 中 ， 我 描述 了 引起 道德 争议 的 三 个 数字 时 代 研 究 项 目 。 接 下 来 ， 
在 6.3 节 中 ， 我 描述 了 数字 时 代 社 会 研究 中 伦理 不 确定 性 的 根本 原因 : 研 
究 人 员 在 未 经 参与 者 同意 甚至 在 其 没有 意识 到 的 情况 下 对 人 们 进行 观察 和 
实验 的 能 力 在 迅速 增强 。 这 些 能 力 的 变化 速度 远 超 我 们 的 规范 、 规 则 和 法 
律 的 修订 速度。 再 者 ， 在 6.4 节 中 ， 我 描述 了 四 个 可 以 指导 你 思想 的 既 有 
原则 : 对 人 的 尊重 原则 、 有 利 化 原则 、 公 正 原 则 和 对 法 律 和 公共 利益 的 苯 
重 原则 。 在 6.5 节 中 ， 我 归纳 了 两 种 广泛 的 道德 框架 ， 结 果 主 义 与 义务 

论 ， 这 可 以 帮助 你 解决 你 可 能 面临 的 最 深刻 的 挑战 之 一 : 何 时 你 适合 采取 
伦理 上 有 问题 的 手段 来 达到 符合 道德 标准 的 目的 。 这 些 原则 和 道德 框架 将 
使 你 超越 现 有 法 规 所 允许 的 范围 去 看 问题 ， 并 提高 你 向 其 他 研究 人 员 和 公 
众 表 达 你 的 判断 的 能 力 。 


基于 这 样 的 背景 ， 在 6.6 节 中 ， 我 讨论 了 数字 时 代 研 究 人 员 面 临 的 四 个 特 
别 的 挑战 : 知情 同意 ( 6.6.1 小 节 ) 、 理 解 与 管理 信息 化 风险 (6.6.2 小 
D), 、 隐 私 权 (6.6.3 小 节 ) ， 以 及 面 对 不 确定 性 做 出 道德 决策 ( 6.6.4 小 
节 ) 。 最 后 ， 在 6.7 节 中 ， 我 归纳 了 三 项 实用 技巧 ， 以 应 对 在 不 稳定 的 道 
德 领域 工作 的 情况 。 


在 整体 范围 方面 ， 本 章 集中 于 从 独立 研究 人 员 的 角度 寻求 可 概括 性 的 知 
识 。 因 此 ， 它 产生 了 关于 改进 研究 伦理 监督 体系 的 重要 问题 、 关 于 管理 公 
司 搜集 和 使 用 数据 的 问题 ， 以 及 对 政府 大 规模 监测 的 质疑 。 这 些 问 题 显 然 
是 复杂 和 困难 的 ， 但 我 希望 研究 伦理 的 一 些 观点 对 这 些 其 他 背景 下 的 研究 
AFTER 


历史 附录 


该 历史 附录 简要 回顾 了 美国 研究 伦理 方面 的 历史 。 


任何 关于 研究 伦理 的 讨论 都 需要 承认 ， 在 过 去 ， 某 些 研 究 人 员 以 科学 的 名 
义 做 了 可 怕 的 事情 。 这 其 中 最 糟糕 的 就 是 塔 斯 基 吉 梅 毒 实验 ( 表 6.4 ) 。 
1932 年 ， 来 自 美 国 公共 卫生 局 的 研究 人 员 在 一 项 研究 中 招募 了 约 400 名 感 
染 梅毒 的 黑人 男 性 ， 以 监测 该 疾病 的 影响 。 这 些 男 性 来 自 亚 拉巴 马 州 的 塔 
斯 基 吉 。 从 一 开始 ， 这 项 研究 就 是 非 治疗 性 的 ， 它 的 目的 仅仅 是 记录 黑人 
See 参与 者 被 隐瞒 了 研究 的 性 质 , 他 们 被 告知 这 是 一 项 败血症 
, 并 且 被 提供 了 虚假 的 和 无 效 的 治疗 ， 而 梅毒 本 身 是 一 种 致命 疾病 。 
ran 的 深入 ， 人 们 开发 出 了 安全 有 效 的 梅毒 治疗 方法 ， 但 该 实验 的 研 
究 人 员 积 极 干预 以 防止 参与 者 在 其 他 地 方 接受 治疗 。 例 如 ， 在 第 二 次 世界 
大 战 期 间 ， 该 研究 小 组 在 研究 中 确保 所 有 人 在 研究 期 间 缓 服 兵役 ， 以 防止 
这 些 男性 进入 部 队 时 获得 治疗 。 研究 iT 人员 40 年 中 持续 欺骗 参与 者 并 拒绝 治 
疗 他 们 。 


表 6.4 塔 斯 基 吉 梅毒 实验 的 部 分 时 间 线 


时 间 事件 


约 400 名 感染 梅毒 的 男性 被 招募 至 研究 中 ， 他 们 并 未 被 告知 研究 
的 真实 目的 


1932 年 


美国 公共 卫生 局 向 该 地 区 派遣 了 移动 治疗 单位 ， 但 拒绝 治疗 研究 
中 的 男性 

为 防止 这 些 受 试 男性 在 研究 中 接受 其 他 地 方 的 治疗 ， 公 共 卫 生 局 
在 第 二 次 世界 大 战 期 间 介 入 ,防止 他 们 服 兵 役 


1937 一 1938 年 


1942 一 1943 年 


青霉素 开始 成 为 治疗 梅毒 的 广泛 有 效 的 措施 ， 但 这 些 受 试 男性 并 


20 世纪 50 年 代 SR 
未 接受 治疗 ( Brandt 1978 ) 


美国 公共 卫生 局 召开 对 该 研究 的 伦理 审查 ， 审 查 小 组 建议 继续 进 


1969 年 SR 
行 该 实验 


美国 公共 卫生 局 前 雇员 彼得 : 巴克 斯 顿 (Peter Buxtun ) 透露 了 该 


1972 年 ; Se 
实验 ， 并 在 媒体 上 公布 这 一 消息 


1972 年 美国 参议 院 召 开 有 关 人 类 实验 的 听证 会 ， 包 括 塔 斯 基 吉 梅 毒 实验 


1973 年 美国 政府 停止 该 实验 并 责令 对 幸存 者 进行 治疗 


1997 年 美国 总 统 比尔 : 克林顿 公开 塔 斯 基 吉 梅 毒 实验 并 进行 官方 道歉 


塔 斯 基 吉 梅 毒 实 验 是 在 当时 美国 南部 地 区 常见 的 种 族 主义 和 极端 不 平等 背 
景 下 进行 的 。 但 是 ， 在 40 年 的 历史 中 ， 这 项 研究 涉及 数 十 名 黑人 受 试 者 和 
白人 研究 人 员 。 除 了 直接 参与 的 研究 人 员 以 外 ， 还 有 很 多 人 肯定 在 已 发 表 
的 医学 文献 中 阅读 过 相关 的 15 篇 研究 报告 中 的 某 一 篇 ( Heller 1972 ) 。 
在 20 世 纪 60 年 代 中 期 ， 也 就 是 研究 开始 大 约 30 年 后 ， 一 位 名 叫 彼得 ' 巴 克 
斯 顿 的 美国 公共 卫生 局 雇员 开始 在 其 内 部 推动 结束 这 一 研究 ， 他 认为 这 种 
研究 在 伦理 上 令 人 无 法 接受 。 作 为 对 巴克 斯 顿 的 回应 ， 美国 公共 卫生 局 在 
1969 年 召集 了 一 个 小 组 ,对 该 研究 进行 了 完整 的 伦理 审查 。 令 人 震惊 的 
是 ， 伦 理 审查 小 组 认为 研究 人 员 应 该 继续 拒绝 给 受 感染 的 男性 提供 治疗 。 
在 评议 的 过 程 中 ， 专 家 组 的 一 位 成 员 甚至 表示 :“ 你 永远 不 会 再 有 这 样 研 
究 的 机 会 ， 好 好 利用 它 吧 。”( Brandt 1978 ) 。 这 个 绝 大 多 数 由 博士 组 成 
的 白人 专家 组 认为 应 该 获取 某 种 形式 的 知情 同意 。 但 是 该 专家 组 也 认为 ， 
由 于 受 试 者 的 年 龄 和 低 教育 程度 问题 ， 他 们 自己 无 法 提供 知情 同意 。 
此 ， 专 家 组 建议 研究 人 员 从 当地 医疗 官员 处 获得 “代理 人 知情 同意 ” 所 
以 ， 经 过 全 面 的 伦理 审查 ， 继 续 治疗 的 建议 被 驳回 。 最 终 ， 巴 克 斯 顿 将 这 
件 事 告诉 了 一 位 记者 。1972 年 ， 简 : 海 勒 (Jean Heller) 撰写 了 一 系列 报 
道 文章 ， 向 全 世界 揭示 了 这 项 研究 。 在 广泛 的 公众 愤怒 情绪 之 下 ， 这 项 研 


究 才 最 终结 束 ， 那 些 幸 存 下 来 的 男性 才 得 到 治疗 。 


该 研究 的 受害 者 并 不 只 是 这 些 男性 ， 还 包括 他 们 的 家 庭 : 至 少 22 名 妻子 、 

17 名 儿女 以 及 2 名 孙子 ， 他 们 均 可 能 由 于 没有 受到 治疗 而 感染 梅毒 ( Yoon 
1997 ) 。 更 进一步 ， 这 项 研究 造成 的 伤害 在 其 结束 后 也 持续 了 很 长 时 间 。 

该 研究 在 法 理 上 减弱 了 非 裔 美国 人 对 医学 界 的 信任 ， 这 种 信任 的 骨 塌 可 能 
导致 非 毅 美国 人 拒绝 医疗 护理 而 损害 他 们 的 健康 ( Alsan and Wanamaker 
2016 ) 。 此 外 ， 缺 乏 信 任 阻 碍 了 在 20 世 纪 80 年 代 和 90 年 代 治 疗 艾滋 病 的 

努力 (Jones 1993， 第 14 章 ) 。 


尽管 我 们 今天 很 难 想象 会 有 如 此 可 怕 的 研究 发 生 ， 但 我 认为 塔 斯 基 吉 梅 毒 
实验 对 于 在 数字 时 代 进 行 社会 研究 的 人 有 三 个 重要 的 经 验 教 训 。 首 先 ， 它 
提醒 我 们 ， 有 些 研究 根本 不 应 该 发 生 。 其 次 ， 它 向 我 们 表明 ， 有 些 研究 可 
能 不 只 对 参与 者 造成 伤害 ， 还 会 在 研究 结束 后 对 他 们 的 家 庭 以 及 整个 社 群 
造成 长 期 伤害 。 最 后 ， 它 告诉 我 们 ， 某 些 研究 人 员 也 可 能 做 出 很 可 怕 的 道 
德 决定 。 事 实 上 ， 我 认为 今天 研究 人 员 应 该 感到 一 些 恐 惧 ， 因 为 参与 这 项 
研究 的 很 多 人 在 如 此 长 的 时 间 内 做 出 并 坚持 了 如 此 糟糕 的 决定 。 并 且 ， 不 
幸 的 是 ， 塔 斯 基 吉 的 例子 并 不 是 唯一 的 ， 那 个 时 代 还 存在 着 许多 在 社会 和 
医疗 研究 中 相似 的 有 问题 的 事例 ( Katz, Capron, and Glass 1972; 
Emanuel et al. 2008 ) 。 


1974 年 ， 为 了 回应 塔 斯 基 吉 梅 毒 实验 及 其 研究 人 员 的 伦理 过 失 ， 美 国 国会 
成 立 了 生物 医学 及 行为 研究 人 体 受 试 者 保护 全 国 委员 会 ( National 
Commission for the Protection of Human Subjects of Biomedical and 
Behavioral Research) ， 并 负责 制定 涉及 人 类 受 试 者 研究 的 伦理 准则 。 在 
贝尔 蒙 会 议 中 心 召 开会 议 的 4 年 后 ， 该 小 组 编写 了 《贝尔 蒙 报告 》， 该 报 
告 对 生物 伦理 学 和 日 常 研究 实践 均 产 生 了 巨大 影响 。 


《贝尔 蒙 报 告 》 由 三 部 分 组 成 。 第 一 部 分 ， 关 于 实践 与 研究 之 间 的 界限 ， 
该 报告 阐明 了 其 权限 范围 。 特 别 是 ， 它 主张 区 分 获取 一 般 化 知识 的 研究 与 
包括 日 常 措施 和 行为 在 内 的 实践 。 此 外 ， 第 一 部 分 讲 到 《贝尔 蒙 报告 》 的 
道德 原则 仅 适 用 于 研究 。 有 人 认为 ， 这 种 研究 和 实践 之 间 的 区 分 是 《贝尔 
莹 报告 》 不 适合 数字 时 代 社 会 研究 的 一 个 原因 (Metcalf and Crawford 
2016; boyd 2016 ) 。 


《贝尔 蒙 报告 》 的 第 二 部 分 和 第 三 部 分 提出 了 三 个 道德 原则 ， 即 对 人 的 苯 
重 原则 、 有 利 化 原则 和 公正 原则 ， 并 描述 了 这 些 原则 要 如 何 应 用 于 研究 实 
践 中 。 这 些 原则 的 细节 我 已 经 在 本 章 的 正文 部 分 讲述 了 。 


《贝尔 蒙 报告 》 设 定 了 广泛 的 目标 ， 但 它 不 是 一 个 可 以 轻松 用 于 监管 日 常 
活动 的 文件 。 因 此 ， 美 国政 府 制定 了 一 套 俗称 为 《通则 》 的 法 规 (Porter 


and Koski 2008 ) 。 这 些 规定 描述 了 审查 、 批 准 和 监督 研究 的 过 程 由 机 构 
审查 委员 会 负责 执行 。 要 理解 《贝尔 蒙 报 告 》 和 《通则 》 之 间 的 区 别 ， 请 
考虑 各 方 如 何 讨论 知情 同意 : 《贝尔 蒙 报 告 》 描 述 了 知情 同意 的 哲学 原因 
和 代表 真正 意义 上 知情 同意 的 广泛 特征 ， 而 《通则 》 列 出 了 知情 同意 的 8 
个 必要 条 件 和 6 个 可 选 要 素 。 根 据 法 律 ，《 通 则 》 管 辖 几 乎 所 有 接受 美国 
政府 资助 的 研究 项 目 。 此 外 ， 许 多 从 美国 政府 获得 资助 的 机 构 通常 将 《 通 
则 》 应 用 于 该 机 构 进行 的 所 有 研究 ， 而 不 考虑 资金 来 源 。 但 《通则 》 并 不 
自动 适用 于 没有 从 美国 政府 获得 研究 经 费 的 公司 。 


我 认为 几乎 所 有 研究 人 员 都 尊重 《贝尔 蒙 报 告 》 所 表达 的 伦理 研究 的 广泛 
目标 ， 但 《通则 》 以 及 与 机 构 审 查 委 员 会 合作 的 过 程 普遍 令 人 感到 烦恼 

( Schrag 2010, 2011; Hoonaard 2011; Klitzman 2015; King and Sands 
2015; Schneider 2015 ) 。 需 要 搞 清楚 的 是 ， 那 些 批评 机 构 审查 委员 会 的 
人 并 不 反对 道德 规范 。 相 反 ， 他 们 认为 目前 的 体系 没有 达到 适当 的 平衡 ， 
或 者 可 以 通过 其 他 方法 更 好 地 实现 其 目标 。 无 论 如 何 ， 我 将 会 把 机 构 审 查 
委员 会 视 作 给 定 条 件 。 如 果 你 需要 遵守 机 构 审 查 委员 会 的 规则 ， 和 那么 你 就 
应 该 这 样 做。 尽管 如 此 ， 我 仍旧 鼓励 你 在 考虑 研究 伦理 时 也 采取 基于 原则 
的 方法 。 


这 一 背景 非常 简要 地 总 结 了 我 们 如 何在 美国 遵守 机 构 审查 委员 会 基于 规则 
的 制度 。 当 我 们 今天 考虑 《贝尔 蒙 报告 》 和 《通则 》 时 ， 应 该 记 住 它们 是 
在 不 同 的 时 代 被 创造 的 ， 并 且 对 当时 产生 的 问题 ， 它 们 做 出 了 相当 明确 的 
回应 ， 特 别 是 对 “二 战 ? 期 间 和 之 后 的 医学 伦理 学 做 出 了 回应 (Beauchamp 
2011 ) 。 


除了 医学 和 行为 科学 家 为 创造 道德 规范 所 做 的 努力 之 外 ， 计 算 机 科学 家 也 
做 出 了 一 些 规模 较 小 且 知 名 度 不 大 的 努力 。 事 实 上 ， 第 一 批 关 注 数字 时 代 
研究 所 带 来 的 伦理 挑战 的 研究 人 员 并 不 是 社会 科学 家 ， 而 是 计算 机 科学 
家 ， 特 别 是 在 计算 机 安全 领域 的 研究 人 员 。 在 20 世 纪 90 年 代 和 21 世 纪 
初 ， 计 算 机 安全 研究 人 员 进 行 了 一 系列 有 道德 的 研究 ， 这 些 研究 涉及 接管 
僵尸 网 络 和 侵入 成 千 上 万 台 弱 加 密 的 计算 机 (Bailey, Dittrich, and 
Kenneally 2013; Dittrich, Carpenter, and Karir 2015 ) 。 针 对 这 些 研究 ， 
美国 政府 部 门 ， 特 别 是 美国 国土 安全 部 设立 了 一 个 蓝 带 委员 会 ， 为 涉及 信 
息 和 通信 技术 的 研究 撰写 指导 性 道德 框架 。 其 成 果 就 是 《 门 罗 报告 》 

( Dittrich, Kenneally, and others 2011 ) 。 尽 管 计算 机 安全 研究 人 员 的 担 
忧 与 社会 研究 人 员 的 担忧 不 尽 相同 ， 但 《 门 罗 报告 》 为 社会 研究 人 员 提 供 


了 三 个 重要 的 指导 。 


首先 ，《 门 罗 报 告 》 再 次 重申 了 《贝尔 蒙 报告 》 中 涉及 的 三 项 基本 原则 ， 
即 对 人 的 尊重 原则 、 有 利 化 原则 以 及 公正 原则 ， 并 附带 了 一 项 新 的 原则 : 
对 法 律 和 公共 利益 的 尊重 原则 。 我 在 本 章 正文 中 描述 了 第 四 项 原则 以 及 它 


如 何 被 应 用 于 社会 研究 (6.4.4 小 节 ) 。 


其 次 ,《 门 罗 报 告 》 呼 吁 研究 人 员 超越 《贝尔 蒙 报告 》 中 “涉及 人 体 科 学 
的 研究 ”的 狭隘 定义 ， 转 而 采用 “具有 潜在 人 身 伤害 的 研究 ”这 一 更 普遍 的 概 
念 。“Encore” 项 目 很 好 地 说 明了 《贝尔 蒙 报 告 》 定 义 范 围 的 局 限 性 。 普 林 
斯 顿 大 学 和 乔治 亚 理工 学 院 的 机 构 审 查 委 员 会 裁定 Encore” 项 目 不 是 “ 涉 
及 人 体 科 学 的 研究 ”, 因此 不 受 《 通 则 》 的 监管 。 然 而 ，“Encore” 项 目 显 
然 具有 人 身 伤害 的 潜力 ; 在 最 极端 的 情况 下 ，“Encore” 项 目 可 能 会 导致 无 
府 的 人 被 专制 政府 监禁 。 基 于 原则 的 方法 意味 着 ， 即 使 机 构 审查 委员 会 同 
意 ， 研 究 人 员 也 不 应 该 隐藏 在 狭隘 的 法 律 定 义 之 后 。 相 反 ， 他 们 应 该 采 

用 “具有 潜在 人 身 伤害 的 研究 ”这 一 更 普遍 的 概念 。 


第 三 ，《 门 罗 报 告 》 呼 吁 研究 人 员 扩 大 在 应 用 《贝尔 蒙 报告 》 原 则 时 考虑 
的 相关 利益 方 。 随 着 研究 已 经 从 单独 的 生活 领域 转移 到 更 加 深入 日 常 活动 
的 领域 ， 伦 理 考虑 的 范围 必须 扩展 到 特定 参与 者 之 外 ， 而 且 应 该 包括 非 参 
与 者 和 研究 发 生 的 环境 。 换 言 之 ,《 门 罗 报 告 》 呼 吁 研究 人 员 扩 大 他 们 的 
道德 领域 ， 而 不 仅仅 考虑 他 们 的 参与 者 。 


本 历史 附录 提供 了 对 社会 科学 、 医 疗 科 学 以 及 计算 机 科学 研究 伦理 的 简要 
回顾 。 有 关 医 疗 科 学 研究 伦理 的 处 理 方式 ， 请 参见 伊 曼 努 尔 等 人 

( Emanuel et al. 2008 ) 或 比 彻 姆 和 奇 尔 德 雷 斯 (Beauchamp and 
Childress 2012 ) 的 长 篇 著作 。 
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